参考书籍 《Robot Vision》 MIT机器视觉课程指定教材
机器视觉探究两个基本问题:
- 成像过程的基本原理是什么?
- 如何探索对成像过程“求逆”的基本知识和方法。
所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。
基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。
- 早期视觉:如何从图像中得到简单的符号描述。
- 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。
文章目录
- 第一章 简介
- 1.1 什么是机器视觉
- 1.2 机器视觉的主要任务是什么
- 1.3 机器视觉与其他相关领域之间的关系
- 1.4 一种关于机器视觉的独特观点
第一章 简介
1.1 什么是机器视觉
- 一个与周围环境进行交互的大的实体的一部分。
- 工业应用中 视觉环境可控且所面临的任务是清晰明确的。
- 致力于构建一个在可控环境中处理特殊任务的系统,或者一些模块。
1.2 机器视觉的主要任务是什么
- 分析采集到的图像;针对某一明确任务,生成一个关于被成像物体(或者场景)的有效符号描述。这个描述将被用于指导机器人系统与周围环境进行交互。(有效符号描述是指:完成任务所需的全部信息。)
例如,机器视觉系统指导机器臂抓取传送带上的零件。视觉系统所要给出的描述包括:零件的位置、朝向以及种类。我们可能只需要几个数字,就能将这个描述表示清楚。 - 从某种意义上讲,视觉系统所要实现的任务可以被看作是成像的逆过程。
1.3 机器视觉与其他相关领域之间的关系
共同的特点:它们都使用图像处理技巧
-
图像处理
从已有的图像产生一张新的图像。输入是图像,输出是新图像。
处理技术来自于线性系统理论。
-
模式分类
对模式进行分类。输入是特征向量,输出是分类结果。
所谓模式是指特征向量,即一组用来表示物体属性的给定数据。
-
场景分析
将从图像中获取的简单描述转化为一个更加复杂的描述。输入是描述,输出是另一种描述。
所谓描述是指为实现任务所需的一系列数据。
对于某些特定任务,复杂描述更有用。
1.4 一种关于机器视觉的独特观点
-
机器视觉应该建立在对成像过程的深刻理解的基础之上!即基于成像分析的方法,有别于基于神经网络的研究方法。
这种观点可以使我们推导出用于进行图像分析的数学模型,而那些 “从图像中恢复出被成像场景的描述” 的算法,正是基于这些数学模型来实现的。
-
机器视觉的核心问题
从一张或者多张图像中生成一个符号描述!
-
从图像中生成符号描述的过程,分为两个阶段:
第一个阶段被称为图像分析,生成一个素描图(例如,二值图)。即一个详尽的、而且未加工处理的描述。
第二个阶段被称为场景分析,生成一个简化的、有结构的描述,用来进行决策。
主要区别:图像分析从图像开始,而场景分析从素描图开始。(图像分析又称早期视觉)
-
估计被成像物体表面的性质是机器视觉的一个重要方面。
-
物体表面的视亮度依赖于三个方面:
物体表面的微结构;
入射光的分布;
物体表面相对于观测者和光源的朝向。
-
为了从图像中恢复出场景信息,我们需要理解:
物体表面的形状;
物体表面的反射性质;
光源的分布;
这三个因素是如何共同决定图像的亮度模式的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)