图像处理与机器视觉复习

2023-05-16

完整资源:GIthub链接

一、填空题

  1. 图像灰度均值、方差

    • 图像的灰度平均值是平指灰度的平均水平。

    • 平均方差是衡量一个样本波动大小的量,对图像来说,平均方差反应的是图像高频部分的大小。方差小,则图片看着较暗;方差大,则图片看着较亮。

    • 灰度的均值代表图像的亮度。
      方差代表其对比度

  2. 采样间距、图像数据量、质量

    • 图像的取样率:单位距离的取样数目(在两个空间方向上)
    • 图像中可分辨的最小细节,主要由采样间隔值决定
    • 采样间隔值越小,空间分辨率越高

    ◆ 一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。


  1. 检测图像边缘的2种数学方法

    一阶微分算子和二阶微分算子。

    一阶:Roberts算子以及在此基础上发展的Sobel算子[9,10]、Isotropic Sobel算子, Prewitt算子、Kirsch算子和Robinson算子等
    二阶:Laplacian算子, LOG算子, DOG算子和Canny算子等

    边缘检测:识别图像中的突然变化(不连续:表面法向量、深度、表面颜色、照明)
    边缘是图像强度函数变化迅速的地方
    梯度指向强度增长最快的方向

    补充学习: 一阶微分和二阶微分的区别:
    (1)一阶微分处理通常会产生较宽的边缘
    (2)二阶微分处理对细节有较强的响应,如细线和孤立点
    (3)一阶微分处理一般对灰度阶梯有较强的响应
    (4)二阶微分处理对灰度级阶梯变化产生双响应
    (5)二阶微分在图像中灰度值变化相似时,对线的响应要比对阶梯强,且点比线强.
          大多数应用中,对图像增强来说.二阶微分处理比一阶微分好,因为形成细节的能力强. 而一阶微分处理主要用于提取边缘.


  2. (低通、高通)滤波器

    都是线性空间域滤波器(非线性:中值、最大值、最小值)
    在这里插入图片描述

    平滑滤波器(低通)
          主要用途:钝化图像、去除噪音
    锐化滤波器(高通)
          主要用途:边缘增强、边缘提取
    带通滤波器
          主要用途:删除特定频率、增强中很少用


  3. 灰度变换函数

    s = T(r)
    三种基本类型

    • ①线性的(正比或反比)
    • ②对数的(对数和反对数的)
    • ③幂次的(n次幂和n次方根变换)

    反转变换: s = L − 1 − r s = L - 1 - r s=L1r

          适于处理增强嵌入于图像暗色区域的白色或灰色细节,特别是当黑色面积占主导地位时.

    对数变换: s = c log ⁡ ( 1 + r ) s = c \log ( 1 + r ) s=clog(1+r)

          使一窄带低灰度输入图像映射为一宽带输出值.可以用于扩展图像中的暗像素.

    幂次变换: s = c r r s = c r ^ { r } s=crr

          幂次曲线中的γ值决定了是把输入窄带暗值映射到宽带输出值还是把输入窄带亮值映射到宽带输出.


  4. 图像量化

    • 数字化坐标值称为取样
    • 数字化幅度值称为量化。

    图像量化(和采样)分为均匀量化和非均匀量化。

    ◆ 量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。


  5. 梯度下降法

    • 梯度下降法的计算过程就是沿梯度下降的方向求解极小值
    • 过梯度下降法并不能保证全局最优解,主要由目标函数的非凸性造成的,容易陷入局部最优解

  6. SLAM

    SLAM:Simultaneous localization and mapping缩写,意为“同步定位与建图”

    主要用于解决机器人在未知环境运动时的定位与地图构建问题

    根据传感器不同分为:视觉SLAM、激光SLAM


  7. ORB特征

    • 特征点的信息
      • 位置、大小、方向、评分等——关键点
      • 特征点周围的图像信息——描述子(Descriptor)

    补充1:特征匹配 :通过描述子的差异判断哪些特征为同一个点


    补充2:特征匹配之后,得到了特征点之间的对应关系
          如果只有两个单目图像,得到2D-2D间的关系 ——对极几何
          如果匹配的是帧和地图,得到3D-2D间的关系 ——PnP
          如果匹配的是RGB-D图,得到3D-3D间的关系 ——ICP


  8. 外参

    对于世界坐标系的旋转和平移。

    两像机间的相对位置和方向。
    旋转矩阵R和平移矢量T


  9. VO(Visual Odometry:视觉里程计)算法通常分为两类

    • 特征点法

    • 直接法


  1. SLAM后端优化

    • 以EKF为代表的滤波方法
    • 以图优化为代表的非线性优化方法

  1. 畸变

    • 径向畸变:由透镜形状引起的畸变称为径向畸变,径向畸变主要分为桶形畸变和枕型畸变
    • 切向畸变:在相机的组装过程中由于不能使透镜严格和成像平面平行,会引入切向畸变

  1. 神经网络前向传播、反向传播

    • 神经网络从输入到输出的计算过程叫做前向传播(Forward propagation)
    • 利用误差反向传播算法进行反向计算的过程也叫反向传播(Backward propagation)。

  2. 池化(汇聚)

    即特征压缩或下采样。

    • 最大池化
    • 平均池化

在这里插入图片描述

  1. 正则化

在这里插入图片描述

<br>
  1. Dropout

    Dropout假设网络间连接越少越好

    我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征

    训练时,减少每次实际参与计算的模型的参数量

    测试时, Dropout会恢复所有的连接,保证模型测试时获得最好的性能。

    步骤

    1. 随机断掉网络部分隐藏神经元
    2. 修改后的网络前项传播,损失结果通过修改的网络反向传播(wb)
    3. 恢复被删刪掉的神经元,重复这一过程

二、简答题

  1. 图像锐化与图像平滑

    • 平滑处理:降低了图像的“尖锐”变化。

    均值滤波器、中值滤波器


    • 锐化处理:突出图像中的细节或者增强被模糊了的细节.

    空间微分。图像微分增强了边缘和其他突变(如噪声)而消弱了灰度变化缓慢的区域.


  2. 电磁波谱成像(举例)

          光 —— 可以被人眼感知的电磁波。(一般人的眼睛可以感知的电磁波的波长在400~760nm之间,但还有一些人能够感知到波长大约在380~780nm之间的电磁波)电磁波是能量的一种,任何有能量的物体,都会释放电磁波。人从物体感受的颜色由物体反射光决定。

    • 若所有反射的可见光波长均衡,则物体显示白色
    • 有颜色的物体是因为物体吸收了其他波长的大部分能量,从而反射某段波长范围的光。
    • 没有颜色的光叫单色光或消色,灰度级通常用来描述单色光的强度,其范围从黑到灰,最后到白。
    • 在原理上,如果可以开发出一种传感器,能够检测由一种电磁波谱发射的能量,就可以在那一段波长上对感兴趣的物体成像。

    无线电波、红外线、可见光、紫外线、X射线、γ射线都是电磁波

    举例:

          γ射线:核医学和天文观测。
         x射线:X光片、CAT扫描
           紫外光成像:平板印刷术、工业检测、显微镜方法、激光、生物成像和天文观测等。
         可见光及红外波段成像:最常见的方式。
         微波成像:雷达
        无线电波成像:核磁共振成像(MRI


  3. 统计排列滤波器

    属于空间平滑滤波器。

          一种非线性滤波器,它的响应基于图像滤波器包围的图像区域中像素的排序,然后由统计排序结果决定的值代替中心像素的值. 最常见的是中值滤波器 。

    中值滤波器:

    • 算法:先将掩模内欲求的像素及其领域的像素值排序(升序或降序),确定出中值,并将中值赋予该像素点.
    • 主要功能:使拥有不同灰度的点看起来更接近于它的邻近值。
    • 主要用途:去除“椒盐”噪声(消除孤立的亮点、暗点)。可以较好地保留图像的细节。

          注:二维中值滤波的窗口形状和尺寸对滤波效果影响较大,不同的图像内容和不同的应用要求,往往采用不同的窗口形状和尺寸。常用的二维中值滤波窗口有线状、方形、圆形、十字形以及圆环形等。窗口尺寸一般先用3X3,再取5×5逐渐增大,直到滤波效果满意为止。就一般经验来讲,对于有缓变的较长轮廓线物体的图像,采用方形或圆形窗口为宜。对于包含有尖顶物体的图像,用十字形窗口,而窗口大小则以不超过图像中最小有效物体的尺寸为宜。如果图像中点、线、尖角细节较多,则不宜采用中值滤波


  4. 立体视觉三角化(SLAM中,下面第二、三张图)

    在这里插入图片描述

    z = B ⋅ f d z = \frac { B \cdot f } { d } z=dBf

    其中: d = x − x ′ d = x - x ^ { \prime } d=xx为视差。


在这里插入图片描述

在这里插入图片描述

  1. 迭代最近点ICP

          ICP算法能够使不同的坐标下的点云数据合并到同一个坐标系统中,首先是找到一个可用的变换,配准操作实际是要找到从坐标系1到坐标系2的一个刚性变换。

          ICP算法本质上是基于最小二乘法的最优配准方法。该算法重复进行选择对应关系点对, 计算最优刚体变换,直到满足正确配准的收敛精度要求。

          ICP 算法的目的是要找到待配准点云数据与参考云数据之间的旋转参数R和平移参数 T,使得两点数据之间满足某种度量准则下的最优匹配

    假设给两个三维点集 X1 和 X2,ICP方法的配准步骤如下:

          第一步,计算X2中的每一个点在X1 点集中的对应近点;

          第二步,求得使上述对应点对平均距离最小的刚体变换,求得平移参数和旋转参数;

          第三步,对X2使用上一步求得的平移和旋转参数,得到新的变换点集;

          第四步, 如果新的变换点集与参考点集满足两点集的平均距离小于某一给定阈值,则停止迭代计算,否则新的变换点集作为新的X2继续迭代,直到达到目标函数的要求。


  2. 立体视觉中大基线和小基线(短基线和长基线)

    • 基线:连接两个摄像机中心的线

在这里插入图片描述
短基线:
      较大的公共视野区域;
      深度误差(不确定区域)较大。
长基线
      公共视野区域较小;
      深度误差(不确定区域)较小。

  1. SLAM方程

    两个基本方程:

    运动方程:
    x k = f ( x k − 1 , u k , w k ) x _ { k } = f ( x _ { k - 1 } , u _ { k } , w _ { k } ) xk=f(xk1,uk,wk)

    观测方程:
    z k , j = h ( x k , y j , v k , j ) z _ { k , j } = h ( x _ { k } , y _ { j } , v _ { k , j } ) zk,j=h(xk,yj,vk,j)


在这里插入图片描述
在这里插入图片描述

  1. 过拟合或者欠拟合(神经网络)

在这里插入图片描述
在这里插入图片描述

> 防止过拟合:正则化、添加动量、学习率衰减、早停、DropOut、数据增强
  1. 激活函数(sigmoid、tanh优缺点)

    激活函数:帮助网络去理解、学习非常复杂的非线性函数,输入产生怎样的响应
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

三、计算题

  1. 推导对极约束方程

    在这里插入图片描述
    在这里插入图片描述


  2. SLAM流程图(每一部分都是干什么)

在这里插入图片描述

传感器数据读取:
  • 在视觉SLAM中主要为相机信息的读取和预处理:获取图片或视频序列
视觉里程计:
* 相邻图像估计相机运动
* 基本形式:通过两张图像计算运动和结构
* 不可避免地有累积漂移

后端优化:
* 从带有噪声的数据中优化轨迹和地图 状态估计问题

回环检测:
* 检测机器人是否回到早先位置
* 识别到达过的场景
* 计算图像间的相似性
* 减小累积误差

建图 :
* 用于导航、规划、通讯、可视化、交互等
* 度量地图 vs 拓扑地图

* 稀疏地图   稠密地图 

  1. SLAM非线性优化的图优化模型

在这里插入图片描述

  1. 简单全连接神经网络结构和参数量(3层)

在这里插入图片描述

  1. LeNet-5

    典型的7层卷积神经网络。3个卷积核。卷——池——卷——池——卷——连——出
    在这里插入图片描述


  2. 投影方程(相机)

在这里插入图片描述

  1. 卷积尺寸计算(输入输出尺寸)
    在这里插入图片描述

    我的补充:卷积参数共享
    在这里插入图片描述

  2. 简单卷积计算(矩阵、卷积核、步长→结果)
    简单

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

图像处理与机器视觉复习 的相关文章

  • MATLAB矩阵和数组相关函数解析

    更新时间2020 04 15 未完结 目录 1 总表2 简单示例2 1 zeros2 2 ones2 3 rand2 4 true and false2 5 eye 1 总表 点击表中函数名可以跳转至官方网站查看精确英文解析 xff0c 也
  • HTTPS、SSL、TLS三者之间的联系和区别

    SSL Secure Socket Layer 安全套接层 是基于HTTPS下的一个协议加密层 xff0c 最初是由网景公司 xff08 Netscape xff09 研发 xff0c 后被IETF xff08 The Internet E
  • Word论文公式的两个格式问题

    更新时间2020 04 16 1 公式居中 xff0c 编号右对齐 solution xff1a 编写一个样式 xff0c 一劳永逸 你要居中 xff0c 你要右对齐 xff0c 先要有个参考 即你居中的 中 是哪里 xff0c 右对齐的
  • HTML- markdown版 江城子·乙卯正月二十日夜记梦

    江城子 乙卯正月二十日夜记梦 宋 苏轼 十年生死两茫茫 xff0c 不思量 xff0c 自难忘 千里孤坟 xff0c 无处话凄凉 纵使相逢应不识 xff0c 尘满面 xff0c 鬓如霜 夜来幽梦忽还乡 xff0c 小轩窗 xff0c 正梳妆
  • Keil μvision已停止工作?

    今天以及几周前我都遇到了这个问题 xff0c 提示消息都是一样的 xff0c Keil vision已停止工作 xff0c 接着keil就自己关闭了 我两次的原因不一样 1 第一次 用的是F407的板子 xff0c 排查了半天错误 xff0
  • 负数取余,取余和取模

    1 圆整 就是把一个小数或者说浮点数按某种规律近似为一个它左边或右边最近的一个整数 比如 xff1a 向负无穷圆整 span class token number 1 8 span span class token operator gt
  • [joint_state_publisher-3] process has died

    我是ROS melodic xff0c 其他版本应该一样的解决方法 去掉urdf xacro launch文件中的中文注释 xff0c 或者改为英文 xff0c 而且第一行不能有中文
  • Ubuntu 18.04安装N卡驱动

    1 原来 xff0c 是英特尔的集显 2 添加N卡驱动 检查是否有GPU显卡 xff0c 我电脑一张集显 xff0c 一张独显 xff0c 很清楚 如果不清楚的可以用 lspci grep i nvidia查看 xff1a linux202
  • ROS Melodic Arbotix报错

    ImportError dynamic module does not define module export function PyInit tf2 xff09 这是我做的内容 xff1a 1 创建一个四轮小车URDF模型 xff0c
  • Matlab画线性规划可行域

    线性规划什么的应该是运筹学的内容 xff0c 虽然数学建模比赛不会考这个 xff0c 但大家日常学习还是会遇到相关的问题 除了用单纯型法 xff0c 也可以用传统的画图法 xff0c 画出可行域 xff0c 再寻求可行解 可行域一般手画更快
  • 浅谈论文目录制作

    先来看咱们CSDN的目录 Markdown语句 xff1a 一级标题 二级标题 三级标题 四级标题 五级标题 六级标题 效果如下 一级标题 二级标题 三级标题 四级标题 五级标题 六级标题 我们论文中的目录道理也是一样 xff0c 无非就是
  • Linux文件系统(一)文件系统基本概念

    文件系统基本概念 1 文件系统概述2 文件系统的类型 xff08 1 xff09 ext系列 xff08 2 xff09 Reiserfs 3 Ubuntu文件系统的结构 xff08 1 xff09 概述 xff08 2 xff09 路径
  • 47、基于51单片机万年历温度闹钟农历阳历LCD 12864显示系统设计

    摘要 本文介绍了基于STC89C52单片机的多功能电子万年历的硬件结构和软硬件设计方法 本设计由数据显示模块 温度采集模块 时间处理模块和调整设置模块四个模块组成 系统以STC89C52单片机为控制器 xff0c 以串行时钟日历芯片DS13
  • Linux文件系统(二)交换分区

    1 交换分区的概念 2 交换分区的管理
  • Linux文件系统(三)文档压缩及解压缩

    1 文档压缩概述 2 图形化归档工具 3 命令行工具
  • Linux文件系统(四)文件系统管理命令

    1 文件系统的基本操作 2 目录的基本操作 3 查看文件内容 4 文件类型 5 查询文件 6 其他管理命令
  • EndNote文献管理(一)雾里看花

    简介
  • EndNote文献管理(二)基操勿六

    1 创建文献数据库并添加文献1 1创建文献数据库1 2在线检索1 3批量导入1 4导入知网文献 2 文献管理2 1文献标记与排序2 2文献速览与下载全文2 3文献阅读与批注 3 编辑参考文献格式 1 创建文献数据库并添加文献 1 1创建文献
  • SQL Server(2019) 实验一 数据库和表的建立

    数据库和表的建立 一 实验目的二 实验内容和要求2 1 数据库的创建 2 2 表的创建 查看 修改和删除 2 2 1 xff0e 表的创建 2 2 2 xff0e 向创建的表中添加数据记录 2 2 3 xff0e 修改表结构 xff08 找
  • SQL Server 中时间的几种表示

    在SQL Server中 xff0c 点开数据类型 xff0c 单单是时间这一类变量都有着多重数据类型 datetimetimestampdatetimedatetime2datetimeoffset 他们的显示效果如下 xff1a spa

随机推荐

  • SQL Server(2019) 实验二 单表查询

    单表查询 一 实验目的二 实验内容和要求2 1 表结构修改2 1 1 xff0e 在实验三的所建立的数据库中增加Teacher表 xff0c 结构如下 xff1a 2 1 2 xff0e 在实验三的所建立的数据库中增加Teaching表 x
  • SQL Server(2019)导入excel数据

    要导入的excel文件如图所示 xff0c 600个记录 操作步骤 xff1a 1 在要导入的数据库上右键 xff0c 任务 xff0c 导入数据 2 选择数据源为excel xff0c 选择相应excel文件 xff0c 选择excel版
  • SQL Server(2019)导出excel数据

    目标 xff1a 将Grademanager数据库中的test表导出为excel test表内容 xff1a 如图 xff0c 600条记录 操作步骤 xff1a 1 在相应数据库上右键 xff0c 任务 xff0c 导出数据 2 选择数据
  • 机器视觉特征提取介绍:HOG、SIFT、SURF、ORB、LBP、HAAR

    一 概述 这里主要记录自己的一些感悟 xff0c 不是很系统 想要详细系统的理论 xff0c 请参考文末的 图像处理之特征提取 个人不是专业cv工程师 xff0c 很多细节没有深究 xff0c 描述可能不严谨 在总结物体检测算法之前先把基础
  • ROS低调复习总结

    ROS复习 一 考试时间 形式 日期二 题型三 不知道随便写四 课程知识点 难点1 1 3章课后复习题1 1 单元测试一1 2 单元测试二1 3 单元测试三 2 第二章 ROS系统架构2 1 比较Topic与Service通信2 2 关闭一
  • 了解Web前端-1 Http基本原理

    HTTP基本原理 1 HTTP协议2 HTTP与Web服务器3 浏览器中的请求和响应1xx 信息2xx 成功3xx 重定向4xx 客户端错误5xx 服务器错误 1 HTTP协议 Hyper Text Transfer Protocol xf
  • 了解Web前端2-HTML语言

    HTML语言 1 什么是HTML2 了解HTML结构4 HTML的基本标签4 1 不是标签4 2 文件开始标签 96 96 4 3文件头部标签 96 96 4 4文件标题标签 96 96 4 5元信息标签 96 96 4 6页面的主体标签
  • 了解Web前端3-CSS层叠样式表

    CSS样式层叠表 1 CSS 概述2 属性选择器2 1属性选择器2 2属性和值选择器2 3属性和值的选择器 多值 3 类和ID选择器3 1ID选择器3 2类选择器3 3为特定元素使用class 1 CSS 概述 CSS是一种标记语言 xff
  • 了解Web前端4-JavaScript动态脚本语言

    JavaScript 动态脚本语言 1 页面中直接嵌入JavaScript代码2 连接外部JavaScript文件 JavaScript 是 web 开发人员必须学习的 3 门语言中的一门 xff1a HTML 定义了网页的内容CSS 描述
  • 爬虫の简介

    爬虫简介 一 什么是爬虫二 Python爬虫架构 一 什么是爬虫 爬虫 xff1a 一段自动抓取互联网信息的程序 xff0c 从互联网上抓取对于我们有价值的信息 二 Python爬虫架构 Python 爬虫架构主要由五个部分组成 xff0c
  • 一个不错的在线作图网站

    菜鸟教程的一个在线工具 连接 xff1a https c runoob com more shapefly diagram 优点 xff1a 没有广告 xff0c 不用关注微信公众号 xff0c 不用登陆 此外 xff0c 菜鸟还提供了其他
  • ABB机器人复习

    1 工业机器人最显著的特点 xff1a 2 工业气人的5种典型的结构 xff1a 3 认识示教器 xff1a 4 ABB机器人坐标系 xff1a 5 轴运动与线性运动 xff1a 1 轴运动 xff1a 2 线性运动 xff1a 6 重定位
  • step7basic的许可无法彻底完成

    安装博途并 后 xff0c 在项目中选择设备时可能会出现 xff1a step7basic的许可无法彻底完成 因为automation license manager中 的报错 原因 xff1a win10系统的更新 xff0c 导致软件不
  • 西门子学习第一章 S7-1200基础

    第一章 1 1 S7 1200系统概述 xff08 1 xff09 PLC 运用领域 xff08 2 xff09 S7 1200外观 xff08 3 xff09 西门子系列分类 1 2博途软件1 3 S7 1200系列PLC的硬件介绍 xf
  • 可见光的波长转换为RGB值颜色,光谱波长与RGBA分量,不同波长的光转换成不同的RGB值,JavaScript版本

    JS版本的光谱波长转换RGBA颜色值的方法 xff0c 在网上没找到 xff0c 后来领导发来一个C 43 43 版本的 xff0c 我对照着改为JS版 xff0c 有需要的朋友 可以参考 xff0c 代码如下 xff1a lt html
  • Modbus TCP Server端(附超全注释)

    实验项目名称 Modbus TCP实验 一 实验目的二 实验内容三 实验环境四 设计方案五 实验结果及分析 xff08 或设计总结 xff09 六 完整代码6 1 server c6 2 respond c6 3 respond h 开发语
  • ORB特征提取和匹配

    一 步骤二 代码三 部分结果展示3 1 使用Sobel算子且方向为vertical xff0c 进行边缘检测3 2 特征点提取 xff08 部分 xff09 3 3 特征点匹配 一 步骤 Step1 xff1a 读取彩色图片 1 新建实验用
  • windows下 Gitee(码云)使用

    1 注册Gitee并新建远程仓库2 初始化本地工作空间3 Git 全局设置 4 SSH公钥绑定5 提交文件到远程仓库 本文前提 xff1a 你已经在windows安装了git xff0c 如图所示 xff0c 关于git的安装 xff0c
  • 在 VS Code 中使用 Git

    1 VS Code安装2 在VS Code中登录Github账号3 Git 安装4 Git配置5 新建远程仓库并用命令行提交6 使用VSCode提交 1 VS Code安装 到vs code官网下载合适的版本并安装 2 在VS Code中登
  • 图像处理与机器视觉复习

    完整资源 xff1a GIthub链接 一 填空题 图像灰度均值 方差 图像的灰度平均值是平指灰度的平均水平 平均方差是衡量一个样本波动大小的量 xff0c 对图像来说 xff0c 平均方差反应的是图像高频部分的大小 方差小 xff0c 则