机器视觉(Robot Vision)——1

2023-05-16

参考书籍   《Robot Vision》  MIT机器视觉课程指定教材

机器视觉探究两个基本问题:

  • 成像过程的基本原理是什么?
  • 如何探索对成像过程“求逆”的基本知识和方法。
    所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。

基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。

  • 早期视觉:如何从图像中得到简单的符号描述。
  • 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。

文章目录

    • 第一章 简介
        • 1.1 什么是机器视觉
        • 1.2 机器视觉的主要任务是什么
        • 1.3 机器视觉与其他相关领域之间的关系
        • 1.4 一种关于机器视觉的独特观点

第一章 简介

1.1 什么是机器视觉

  • 一个与周围环境进行交互的大的实体的一部分。
  • 工业应用中 视觉环境可控且所面临的任务是清晰明确的。
  • 致力于构建一个在可控环境中处理特殊任务的系统,或者一些模块。

1.2 机器视觉的主要任务是什么

  • 分析采集到的图像;针对某一明确任务,生成一个关于被成像物体(或者场景)的有效符号描述。这个描述将被用于指导机器人系统与周围环境进行交互。(有效符号描述是指:完成任务所需的全部信息。)
    例如,机器视觉系统指导机器臂抓取传送带上的零件。视觉系统所要给出的描述包括:零件的位置、朝向以及种类。我们可能只需要几个数字,就能将这个描述表示清楚。
  • 从某种意义上讲,视觉系统所要实现的任务可以被看作是成像的逆过程。

1.3 机器视觉与其他相关领域之间的关系

共同的特点:它们都使用图像处理技巧

  • 图像处理
    从已有的图像产生一张新的图像。输入是图像,输出是新图像。
    处理技术来自于线性系统理论。

  • 模式分类
    对模式进行分类。输入是特征向量,输出是分类结果。
    所谓模式是指特征向量,即一组用来表示物体属性的给定数据。

  • 场景分析
    将从图像中获取的简单描述转化为一个更加复杂的描述。输入是描述,输出是另一种描述。
    所谓描述是指为实现任务所需的一系列数据。
    对于某些特定任务,复杂描述更有用。

1.4 一种关于机器视觉的独特观点

  • 机器视觉应该建立在对成像过程的深刻理解的基础之上!即基于成像分析的方法,有别于基于神经网络的研究方法。
    这种观点可以使我们推导出用于进行图像分析的数学模型,而那些 “从图像中恢复出被成像场景的描述” 的算法,正是基于这些数学模型来实现的。

  • 机器视觉的核心问题
    从一张或者多张图像中生成一个符号描述!

  • 从图像中生成符号描述的过程,分为两个阶段:
    第一个阶段被称为图像分析,生成一个素描图(例如,二值图)。即一个详尽的、而且未加工处理的描述。
    第二个阶段被称为场景分析,生成一个简化的、有结构的描述,用来进行决策。
    主要区别:图像分析从图像开始,而场景分析从素描图开始。(图像分析又称早期视觉)

  • 估计被成像物体表面的性质是机器视觉的一个重要方面。

  • 物体表面的视亮度依赖于三个方面:
    物体表面的微结构;
    入射光的分布;
    物体表面相对于观测者和光源的朝向。

  • 为了从图像中恢复出场景信息,我们需要理解:
    物体表面的形状;
    物体表面的反射性质;
    光源的分布;
    这三个因素是如何共同决定图像的亮度模式的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器视觉(Robot Vision)——1 的相关文章

  • 深度学习相关资料总结

    近这两年里deep learning技术在图像识别和跟踪等方面有很大的突破 是一大研究热点 里面涉及的数学理论和应用技术很值得深入研究 这里总结一些在微博发布和转载的相关资料 以便查阅 一 winsty NIPS2013 Learning
  • 【神经网络深度学习】--语义分割 Unet

    Unet 发表于 2015 年 属于 FCN 的一种变体 Unet 的初衷是为了解决生物医学图像的问题 由于效果确实很好后来也被广泛的应用在语义分割的各个方向 如卫星图像分割 工业瑕疵检测等 Unet 跟 FCN 都是 Encoder De
  • 添加高斯噪声

    coding utf 8 import cv2 as cv import numpy as np import sys def add noise image mean 0 val 0 01 size image shape image i
  • 开始使用OpenCV

    开始使用OpenCV 1 编译OpenCV 1 1 使用命令行的方式配置OpenCV OpenCV官网教程 OpenCV官网教程使用命令行的方式进行配置 写的很详细 按照教程操作 一般都能成功 由于国内访问GitHub不稳定 所以推荐使用w
  • 知乎上对 国内机器视觉行业的发展的 讨论-经典

    如何看待国内机器视觉行业的发展 希望以公司为例盘点 最近关注机器人领域 图像识别行业 感觉国内视觉公司对工业自动化方向更为关注 说说大家对于机器视觉行业发展的看法 以及给研发人员职业规划的建议 添加评论 分享 按投票排序 按时间排序 8 个
  • 像素和毫米怎么换算

    像素和毫米怎么换算 像素和毫米是不能直接转换的 只有在分辩率 dpi 下才能进行转换 因此 像素与毫米的转换 需要知道参数 DPI 每英寸多少点 象素数 DPI 英寸数 英寸数 25 4 毫米数 对于显示设备 不管是打印机还是屏幕 都有一种
  • sudo rosdep init ERROR: cannot download default sources list from:解决办法

    sudo rosdep init ERROR cannot download default sources list from 解决方法 进入 etc hosts文件目录 2 进入到hosts 文件 root ros vm2 etc ge
  • Ciclop开源3D扫描仪软件---Horus源码分析之point_cloud_roi.py

    联系方式 QQ 2468851091 call 18163325140 Email 2468851091 qq com coding utf 8
  • 机器视觉及其应用发展

    导读 一 机器视觉的研究和发展动态 机器视觉的研究 发展和应用还远没有达到成熟的程度 机器视觉从诞生到今天才只有短短的三十多年时间 在机器视觉中承担 大脑 作用的图像分析处理 图像理解和模式识别理论和技术基础还非常不完善 甚至 机器视觉的图
  • Halcon三维模型预处理(1):调平的三大手法

    面结构光拍摄生成的点云模型 往往相对系统坐标系是有角度的 首先讲一下调平的目的 1 为接下来的预处理切除背景面做准备 3 不做调平 后续处理会很麻烦 因为不清楚坐标系在平台的为位置 2 对于无序抓取项目 平台相对相机可能是有角度的 将抓取平
  • OpenCV相机标定全过程

    一 OpenCV标定的几个常用函数 findChessboardCorners 棋盘格角点检测 bool findChessboardCorners InputArray image Size patternSize OutputArray
  • 拉普拉斯的原理

    拉普拉斯是一种二阶导数算子 是一个与方向无关的各向同性 旋转轴对称 边缘检测算子 若只关心边缘点的位置而不顾其周围的实际灰度差时 一般选择该算子进行检测 拉普拉斯算子为二阶差分 其方向信息丢失 常产生双像素 对噪声有双倍加强作用 因此它很少
  • 基于OpenCV3.0图像处理中常见的五个滤波函数

    初学OpenCV的开发者很容易被OpenCV中各种滤波方法所困扰 不知道到底该用哪里一个来做滤波 表面原因看起来是因为OpenCV中各种滤波方式实在是太多太杂 其背后原因是对各种滤波方法的应用场景认知出现了问题 所以这里小编从应用场景与项目
  • 机器视觉(十一):一维条码识别

    目录 机器视觉 一 概述 机器视觉 二 机器视觉硬件技术 机器视觉 三 摄像机标定技术 机器视觉 四 空域图像增强 机器视觉 五 机器视觉与世界杯 机器视觉 六 频域图像增强 机器视觉 七 图像分割 机器视觉 八 图像特征提取 机器视觉 九
  • OpenCV学习笔记(17)双目测距与三维重建的OpenCV实现问题集锦(二)双目定标与双目校正

    三 双目定标和双目校正 双目摄像头定标不仅要得出每个摄像头的内部参数 还需要通过标定来测量两个摄像头之间的相对位置 即右摄像头相对于左摄像头的三维平移 t 和旋转 R 参数 图6 要计算目标点在左右两个视图上形成的视差 首先要把该点在左右视
  • CV 经典主干网络 (Backbone) 系列: CSP-Darknet53

    CSP Darknet53 0 引言 1 网络结构图 1 1 输入部分 1 2 CSP部分结构 1 3 输出部分 2 代码实现 2 1 代码整体实现 2 2 代码各个阶段实现 3 代码测试 4 结论 0 引言 CSP Darknet53无论
  • 手动切换 Kinect 的驱动程序(for OpenNI 1.* & Microsoft Kinect SDK 1.7)

    微软最近推出了最新版的 Kinect SDK 能够实现实时的 Kinect Fusion 并提供了丰富的手势交互功能 对体感交互开发人员的吸引力越来越大 而 OpenNI 2 0 以上的版本也转为使用微软官方的 Kinect 驱动 也显示了
  • WPF Windows 上的夜视模式

    我们使用传统 UI 常见控件 如选项卡 按钮 标签 文本框等 制作了一个 WPF 应用程序 我们需要添加一个 夜视 模式 让它看起来像Stellarium的夜视模式 这样它就可以在光线很少或根本没有光线的地方舒适地使用 据我所知 我们只有两
  • open3D点云分割

    将底面和物体分割开 import time import open3d as o3d import numpy as np mesh box o3d geometry TriangleMesh create box width 0 4 he
  • Android Vision Api - 条码检测如何获取条码类型?

    我正在使用 AndroidGoogle Vision API 并创建了一个标准条形码阅读器 但我想检测读取什么类型 格式的条形码 i e CODE 39 CODE 128 QR Code ETC 有没有办法返回类型 Thanks 因为我没有

随机推荐

  • LED驱动电路的分析

    文章目录 一 方案一 1 电路工作原理 2 组件选择 3 个人分析 二 方案二 在方案一的基础上改进 1 电路工作原理 2 个人分析 三 方案三 在方案一的基础上改进 1 电路工作原理 2 个人分析 参考连接 常见驱动电路的分析 一 方案一
  • linux基础操作之二

    文章目录 6 文件解压与打包1 概念讲解2 实战1 zip 压缩打包程序2 使用 unzip 命令解压缩 zip 文件3 tar 打包工具4 总结 7 文件系统操作与磁盘管理1 查看磁盘和目录的容量2 dd 命令简介3 使用 dd 命令创建
  • mmap的使用

    参考资料 mmap 函数 xff1a 原理与使用 含代码 mmap函数使用与实例详解 Linux系统编程 xff1a mmap使用技巧 mmap和普通文件读写的区别和比较 amp mmap的注意点 认真分析mmap xff1a 是什么 为什
  • LED高效恒流驱动电源的设计指导书

    参考链接 LED高效恒流驱动电源的设计指导书 LED灯驱动电源设计 LED恒流驱动电路 精 LED恒流驱动电路 led灯驱动电源电路图 led灯的驱动原理电路图方案详解 KIA MOS管 一 LED驱动电源原理 1 由于LED的光特性通常都
  • 恒流源驱动电路 随笔一

    方案一 参考论文 LED光源驱动电路研究 华科 硕士 08 06 采用恒流源控制的原因 1 LED的PN结的温度系数为负 温度升高时LED的势垒电势降低 由于这个特点 所以LED不能直接用电压源供电 必须采用限流措施 否则LED随着工作时温
  • 恒流源驱动电路 随笔二

    参考论文 LED的驱动电路研究 大理 硕士 07 06 三个简单方案 电荷泵驱动的典型电路 CAT3604是一个工作在1x 1 5x分数模式下的电荷泵 可调节每只LED白光管脚 xff08 共4只LED管脚 xff09 的电流 使背光的亮度
  • gcc编译c文件常用命令参数解释

    gcc编译c文件 gcc是常用来编译c语言程序的编译器 xff0c 了解它编译c语言的命令参数 xff0c 对c c 43 43 语言的学习是有一定好处的 gcc编译文件一步到位的命令格式 gcc main c o main exe 设置了
  • 恒流源驱动电路 随笔三

    参考论文一 LED蓝绿光黄疸光疗系统的研究与设计 天工 硕士 15 12 AMC7150是一种仅需 xff15 个外部零件的高功率LED驱动IC AMC7150内建P xff37 xff2d 和功率晶体管 xff0c 工作频率可达200kH
  • 光源系统厂商、结构

    参考论文 基于PWM的LED机器视觉光源技术的研究 哈工大 硕士 span class token number 2009 span fpga 前言 机器视觉系统包括 xff1a 照明 镜头 相机 图像采集卡 视觉处理器 led光源分为两大
  • LED驱动IC厂家

    厂家芯片类别 世微半导体 英飞凌Infineon 壹芯半导体科技 xff08 深圳 xff09 有限公司 欧司朗OSRAM xff1a 汽车照明 深圳天微电子有限公司 中铭电子 深圳市华芯光电有限公司 宁波欧特电子科技有限公司 芯片介绍 l
  • 2D/3D模板匹配

    2D 对象 正交视图 物体的组成部分之间的角度和距离可以改变 xff0c 不需要缩放 需要缩放 存在遮挡 杂乱或颜色 物体的特征是具有特定的纹理 xff0c 而不是清晰可见的轮廓 图像高度散焦 对象变化显著 期望物体轮廓的局部变形 xff0
  • linux基础操作之三

    文章目录 10 命令执行顺序控制与管道命令执行顺序的控制1 顺序执行多条命令2 有选择的执行命令 管道3 1 试用3 2 cut 命令 xff0c 打印每一行的某一字段3 3 grep 命令 xff0c 在文本中或 stdin 中查找匹配字
  • 2020华为软挑总结——baseline

    span class token macro property span class token directive keyword include span span class token string lt bits stdc 43
  • 2020华为软挑总结——复赛方案一code

    span class token macro property span class token directive keyword include span span class token string lt iostream gt s
  • 2020华为软挑总结——方案二code

    span class token macro property span class token directive keyword include span span class token string lt iostream gt s
  • 机器视觉照明技术与装置实验研究(论文纪要)

    参考文献 机器视觉照明技术与装置实验研究 中原 硕士 2016 有用 摘要 图片质量很大程度上是由目标周围的照明环境和目标物体表面材质 物体摆放位置所决定的 1 首先 xff0c 对照明系统主要技术进行了研究 研究内容包括光源的参数与选择
  • Affine Transformations(仿射变换)

    英文版原文链接 先修教程 xff1a Remapping 重映射 下一教程 xff1a Histogram Equalization 直方图均衡化 文章目录 结果目标原理什么是仿射变换 我们如何得到一个仿射变换 代码这个程序是做什么的 代码
  • Linux 网桥功能使用

    Linux 网桥功能使用 网桥是在数据链路层 xff0c 将两个LAN连接起来 xff0c 根据MAC地质来转发帧 xff0c 可以看作是低层的路由器 安装网桥配置工具 检测系统中是否有有bridge 工具 xff1a rpm qa gre
  • Remapping(重映射)

    英文版原文链接 上一教程 xff1a Hough Circle Transform Hough圆变换 下一教程 xff1a Affine Transformations 仿射变换 文章目录 结果目标原理什么是重映射 xff1f 代码这个程序
  • 机器视觉(Robot Vision)——1

    参考书籍 Robot Vision MIT机器视觉课程指定教材 机器视觉探究两个基本问题 xff1a 成像过程的基本原理是什么 xff1f 如何探索对成像过程 求逆 的基本知识和方法 所谓 求逆 xff1a 具体来说 xff0c 就是从一张