图像处理知识框架

2023-11-18

转自https://blog.csdn.net/hitwengqi/article/details/8292675

花了点时间整理了一下数字图像处理知识体系，从宏观上把握图像处理，使自己的学习思路就更加清晰。
1.本文大部分内容来自：http://blog.csdn.net/byxdaz/article/details/4375228
2.有些内容待添加，特别是opencv相关的算法实现。

目录
一、数字图像基础… 3
二、数字图像存储与显示… 3
三、图像变换… 4
1.卷积… 4
2.梯度和Sobel导数… 5
3.拉普拉斯变换… 5
4.Canny算子… 5
5.霍夫变换… 5
6.重映射… 5
7.几何操作：拉伸、收缩、扭曲和旋转… 5
8.离散傅里叶变换（DFT）… 5
9.离散余弦变换（DCT）… 5
四、形态学图像处理… 5
1.平滑处理… 5
2.膨胀与腐蚀… 5
3.开操作与闭操作… 5
4.漫水填充算法… 5
5.尺寸调整… 5
6.图像金字塔… 6
7.阈值化… 6
五、图像边缘检测… 6
六、图像增强和复原… 8
1.图像增强… 8
（1）空间域增强处理… 8
（2）频率域增强处理… 9
2.图像复原… 11
七、图像压缩… 11
八、图像分割… 12
九、图像特征提取与匹配… 13
十、图像分类（识别）… 15

数字图像处理[wq1] 是对图像进行分析、加工、和处理，使其满足视觉、心理以及其他要求的技术。图像处理是信号处理在图像域上的一个应用。目前大多数的图像是以数字形式存储，因而图像处理很多情况下指数字图像处理。此外，基于光学理论的处理方法依然占有重要的地位。数字图像处理是信号处理的子类，另外与计算机科学、人工智能等领域也有密切的关系。传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上，比如降噪、量化等。然而，图像属于二维信号，和一维信号相比，它有自己特殊的一面，处理的方式和角度也有所不同。大多数用于一维信号处理的概念都有其在二维图像信号领域的延伸，它们中的一部分在二维情形下变得十分复杂。同时图像处理也具有自身一些新的概念，例如，连通性、旋转不变性，等等。这些概念仅对二维或更高维的情况下才有非平凡的意义。图像处理中常用到快速傅立叶变换，因为它可以减小数据处理量和处理时间。
数字图像处理应用在以下方面：
摄影及印刷 (Photography and printing)
卫星图像处理 (Satellite imageprocessing)
医学图像处理 (Medical image processing)
面孔识别, 特征识别 (Face detection,feature detection, face identification)
显微图像处理 (Microscope imageprocessing)
汽车障碍识别 (Car barrier detection)
一、数字图像基础
图像的基本概念、图像取样和量化、数字图像表示、空间和灰度级分辨率、图像纹理、像素间的一些基本关系（相邻像素、邻接性、连通性、区域和边界、距离度量）[wq2] 、线性和非线性变换操作。[wq3]
常用色彩空间分类：

二、数字图像存储与显示
在计算机中，有两种类型的图：矢量图(vector graphics)和位映象图(bitmappedgraphics)。矢量图是用数学方法描述的一系列点、线、弧和其他几何形状，如图(a)所示。因此存放这种图使用的格式称为矢量图格式，存储的数据主要是绘制图形的数学描述；位映象图(bitmappedgraphics)也称光栅图(raster graphics)，这种图就像电视图像一样，由象点组成的，如图(b)，因此存放这种图使用的格式称为位映象图格式，经常简称为位图格式，存储的数据是描述像素的数值。

图像格式目前包括bmp格式、gif格式、jpeg格式、jpeg2000格式、tiff格式、psd格式、Png格式、swf格式、svg格式、pcx格式、dxf格式、wmf格式、emf格式、LIC格式、eps格式、TGA格式等。

目前比较出名的图像处理库有很多，比如LEADTOOLS、OPENCV，LEADTOOLS这个是功能非常强大的图像多媒体库，但是这个是收费注册的。OpenCV 是一个跨平台的中、高层 API 构成，目前包括 300 多个 C 函数。它不依赖与其它的外部库，尽管也可以使用某些外部库。OpenCV 对非商业用途和商业用途都是免费（FREE）的。开源的图像库也有不少，比如：ImageStone、GIMP、CxImage等，虽然它们的功能没有LEADTOOLS强大[wq4] ，但是一般的图像处理是可以应付的。
三、图像变换
由于图像阵列很大，直接在空间域[wq5] 中进行处理，涉及计算量很大。因此，往往采用各种图像变换的方法，如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术，将空间域的处理转换为变换域处理，不仅可减少计算量，而且可获得更有效的处理（如傅立叶变换可在频域中进行数字滤波处理）。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性，它在图像处理中也有着广泛而有效的应用。
图像变换，也认为是将一副图像转变成图像数据。
1. 卷积

梯度和Sobel导数[wq6]
拉普拉斯变换[wq7]
Canny算子
霍夫变换
重映射
几何操作：拉伸、收缩、扭曲和旋转[wq8]
离散傅里叶变换（DFT）
离散余弦变换（DCT）

四、形态学图像处理
1. 平滑处理

膨胀与腐蚀
开操作与闭操作
漫水填充算法
尺寸调整
图像金字塔
阈值化

五、图像边缘检测
数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域十分重要的基础，图像理解和分析的第一步往往就是边缘检测，目前它以成为机器视觉研究领域最活跃的课题之一，在工程应用中占有十分重要的地位。所谓边缘就是指图像局部亮度变化最显著的部分，它是检测图像局部变化显著变化的最基本的运算。边缘的记录有链码表和线段表2种，链码表适合计算周长，线段表容易计算面积以及相关的，他们之间可以相互的转换。
迄今为止，已经出现了许多成熟的算法。例如微分算法，掩模算法等。在微分算法中，常使用N*N的像素块，例如3*3或者4*4。3*3的像素块如下，
f(i-1,j-1) f(i-1,j) f(i-1,j+1)
f(i,j-1) f(i,j) f(i,j+1)
f(i+1,j-1) f(i+1,j) f(i+1,j+1)
我们不妨设f(i,j)为待处理的像素，而g(i, j)为处理后的像素。
常见的边缘检测算法：
A． Roberts边缘算子
g(i, j) = sqrt( (f(i, j) - f(i + 1, j))^2 + (f(i + 1, j) - f(i, j +1))^2 )
或者
g(i, j) = |f(i,j) - f(i + 1,j)| + |f(i+1,j) - f(i,j+1)|
B． Sobel边缘算子
对数字图像的每一个像素f(i,j),考察它的上、下、左、右邻域灰度的加权值，把各方向上(0度、45度、90度、135度)的灰度值加权之和作为输出，可以达到提取图像边缘的效果。
即 g(i,j) = fxr + fyr, 其中
fxr = f(i-1,j-1)+2*f(i-1,j)+f(i-1,j+1)-f(i+1,j-1)-2*f(i+1,j)-f(i+1,j+1)
fyr = f(i-1,j-1)+2*f(i,j-1)+f(i+1,j-1)-f(i-1,j+1)-2*f(i,j+1)-f(i+1,j+1)
C． Laplace算子
Laplace算子是一种二阶微分算子。它有两种形式:4邻域微分算子和8邻域微分算子。
⊙ 4邻域微分
g(i,j)=|4*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)|
⊙ 8邻域微分
g(i,j)=|8*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)-f(i-1,j-1)-f(i-1,j+1)-f(i+1,j-1)-f(i+1,j+1)|
D． Prewitt边缘算子
prewitt算子是一个边缘模板算子，由八个方向的样板组成，能够在0度，45度，90度，135度，180度，225度角
等八个方向检测边缘。8个3*3边缘模板及方向如下：
90度角: 45度角:
1 1 1 -1 -1 -1
1 -2 1 1 -2 1
-1 -1 -1 1 1 1
0度角: 315度角:
-1 1 1 1 1 -1
-1 -2 1 1 -2 -1
-1 1 1 1 1 -1
270度角： 225度角:
1 1 1 -1 -1 1
-1 -2 1 -1 -2 1
-1 -1 1 1 1 1
180度角： 135度角：
1 1 1 1 -1 -1
1 -2 -1 1 -2 -1
1 -1 -1 1 1 1
3*3时表达式如下:
A1*f(i-1,j-1) A8*f(i,j-1) A7*f(i+1,j-1)
A2*f(i-1,j) -2*f(i,j) A6*f(i+1, j)
A3*f(i-1,j+1) A4*f(i,j+1) A5*f(i+1,j+1)
g(i,j)=|-2*f(i,j)+A8*f(i,j-1)+A1*f(i-1,j-1)+A2*f(i-1,j)+A3*f(i-1,j+1)+A4*f(i,j+1)+A5*f(i+1,j+1)+A6*f(i+1,j)+A7*f(i+1,j-1)|
在程序设计中，依次用样板去检测图像，与被检测区域最为相似的样板给出最大值，用该最大值作为算子的输出值。
E．Kirsch边缘算子
Kirsch算子是一个模板算子，由八个方向的边缘样板组成，能够在0度，45度，90度，135度，180度，225度角
等八个方向检测边缘。8个3*3边缘模板及方向如下：
90度角: 45度角:
5 5 5 -3 5 5
-3 0 -3 -3 0 5
-3 -3 -3 -3 -3 -3
0度角: 315度角:
-3 -3 5 -3 -3 -3
-3 0 5 -3 0 5
-3 -3 5 -3 5 5
270度角： 225度角:
5 5 -3 -3 -3 -3
5 0 -3 5 0 -3
-3 -3 -3 5 5 -3
180度角： 135度角：
5 -3 -3 5 5 -3
5 0 -3 5 0 -3
5 -3 -3 -3 -3 3
使用方法与prewitt算子一样。
F．CANNY边缘检测
六、图像增强和复原
图像增强和复原的目的是为了提高图像的质量，如去除噪声，提高图像的清晰度等。图像增强不考虑图像降质的原因，突出图像中所感兴趣的部分。如强化图像高频分量，可使图像中物体轮廓清晰，细节明显；如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解，一般讲应根据降质过程建立“降质模型”，再采用某种滤波方法，恢复或重建原来的图像。
1. 图像增强
图像增强的目的在于改善图像的显示质量，以利于信息的提取和识别。从方法上说，则是设法摒弃一些认为不必要或干扰的信息，而将所需要的信息得以突出出来，以利于分析判读或作进一步的处理。
（1）空间域增强处理
空间域是指图像平面所在的二维空间，空间域图像增强是指在图像平面上应用某种数学模型，通过改变图像像元灰度值达到增强效果，这种增强并不改变像元的位置。空域增强包括空域变换增强与空域滤波增强两种。空域变换增强是基于点处理的增强方法、空域滤波增强是基于邻域处理的增强方法。
1）空域变换增强
常用的空域变换增强方法包括：对比度增强、直方图增强和图像算术运算等。
A．对比度增强
对比度增强是一种通过改变图像像元的亮度分布态势，扩展灰度分布区间来改变图像像元对比度，从而改善图像质量的图像处理方法。因为亮度值是辐射强度的反映，所以也称为辐射增强。常用的方法有对比度线性变换和非线性变换。其关键是寻找到一个函数，以此函数对图像中每一个像元进行变换，使像元得到统一的重新分配，构成得到反差增强的图像。
B．直方图增强
直方图均衡化：
直方图均衡化基本做法是将每个灰度区间等概率分布代替了原来的随机分布，即增强后的图象中每一灰度级的像元数目大致相同。直方图均衡化可使得面积最大的地物细节得以增强，而面积小的地物与其灰度接近的地物进行合并，形成综合地物。减少灰度等级换取对比度的增大。
直方图归一化：
直方图归一化是把原图像的直方图变换为某种指定形态的直方图或某一参考图像的直方图，然后按着已知的指定形态的直方图调整原图像各像元的灰级，最后得到一个直方图匹配的图像。这种方法主要应用在有一幅很好的图像作为标准的情况下，对另一幅不满意的图像用标准图像的直方图进行匹配处理，以改善被处理图像的质量。如在数字镶嵌时，重叠区影像色调由于时相等原因差异往往很大，利用直方图匹配这一方法后可以改善重叠区影像色调过度，如果镶嵌图像时相相差不大，完全可以作到无缝镶嵌。
C．数字图像的算术运算
两幅或多幅单波段影像，完成空间配准后，通过一系列运算，可以实现图像增强，达到提取某些信息或去掉某些不必要信息的目的。
2）空域滤波增强
空域变换增强是按像元逐点运算的，从整体上改善图像的质量，并不考虑周围像元影响。空间滤波增强则是以重点突出图像上的某些特征为目的的（如突出边缘或纹理等），通过像元与周围相邻像元的关系，采取空间域中的邻域处理方法进行图像增强。邻域法处理用于去噪声、图像平滑、锐化和相关运算。
图像卷积运算是在空间域上对图像作局部检测的运算，以实现平滑和锐化的目的。具体作法是选定一卷积函数，又称为“M×N窗口”或“模板”，如3×3或5×5等。然后从图像左上角开始开一与模板同样大小的活动窗口，图像窗口与模板像元的亮度值对应相乘再相加。将计算结果赋予中心像元作为其灰度值，然后待移动后重新计算，将计算结果赋予另一个中心像元，以此类推直到全幅图像扫描一遍结束生成新的图像。
平滑是指图像中出现某些亮度变化过大的区域，或出现不该有的亮点（“噪声”）时，采用平滑方法可以减小变化，使亮度平缓或去掉不必要“噪声”点。它实际上是使图像中高频成分消退，即平滑图像的细节，降低其反差，保存低频成分，在频域中称为低通滤波。具体方法有：均值平滑、中值滤波、锐化。
锐化的作用在于提高边缘灰度值的变化率，使界线更加清晰。它是增强图像中的高频成分，在频域处理中称为高通滤波，也就是使图像细节的反差提高，也称边缘增强。要突出图像的边缘、线状目标或亮度变化率大的部分常采用锐化方法。一般有三种实现方法：
A．梯度法
梯度反映了相邻像元的亮度变化率，即图像中如果存在边缘，如湖泊、河流的边界，山脉和道路等，则边缘处有较大的梯度值。对于亮度值较平滑的部分，亮度梯度值较小。因此，找到梯度较大的位置，也就找到边缘，然后再用不同的梯度计算值代替边缘处像元的值，也就突出了边缘，实现了图像的锐化。通常有罗伯特梯度和索伯尔梯度方法。
B．拉普拉斯算法
拉普拉斯算法的意义与梯度法不同，它不检测均匀的亮度变化，而是检测变化率的变化率，相当于二阶微分。计算出的图像更加突出亮度值突变的位置。
C．定向检测
当有目的地检测某一方向的边、线或纹理特征时，可选择特定的模板卷积运算作定向检测。可以检测垂直边界、水平边界和对角线边界等，各使用的模板不同。
（2）频率域增强处理
频域增强指在图像的频率域内，对图像的变换系数（频率成分）直接进行运算，然后通过Fourier逆变换以获得图像的增强效果。一般来说，图像的边缘和噪声对应Fourier变换中的高频部分，所以低通滤波能够平滑图像、去除噪声。图像灰度发生聚变的部分与频谱的高频分量对应，所以采用高频滤波器衰减或抑制低频分量，能够对图像进行锐化处理。频域，就是由图像f(x,y)的二维傅立叶变换和相应的频率变量(u,v)的值所组成的空间。在空间域图像强度的变化模式（或规律）可以直接在该空间得到反应。F(0,0)是频域中的原点，反应图像的平均灰度级，即图像中的直流成分；低频反映图像灰度发生缓慢变化的部分；而高频对应图像中灰度发生更快速变化的部分，如边缘、噪声等。但频域不能反应图像的空间信息。

空域和频域滤波间的对应关系，卷积定理是空域和频域滤波的最基本联系纽带。二维卷积定理：

基本计算过程：
取函数h(m,n)关于原点的镜像，得到h(-m,-n)
对某个(x,y),使h(-m,-n)移动相应的距离，得到h(x-m,y-n)
对积函数f(m,n)h(x-m,y-n)在(m,n)的取值范围内求和
位移是整数增量，对所有的(x,y)重复上面的过程，直到两个函数：f(m,n)和h(x-m,y-n)不再有重叠的部分。
傅立叶变换是空域和频域的桥梁，关于两个域滤波的傅立叶变换对：

频域与空域滤波的比较：
1. 对具有同样大小的空域和频率滤波器：h(x,y), H(u,v)，频域计算(由于FFT)往往更有效(尤其是图像尺寸比较大时）。但对在空域中用尺寸较小的模板就能解决的问题，则往往在空域中直接操作。
2. 频域滤波虽然更直接，但如果可以使用较小的滤波器，还是在空域计算为好。因为省去了计算傅立叶变换及反变换等步骤。
3. 由于更多的直观性，频率滤波器设计往往作为空域滤波器设计的向导。
平滑的频率域滤波器类型：
1 、理想低通滤波器
2 、巴特沃思低通滤波器
3 、高斯低通滤波器
频率域锐化滤波器类型：
1 理想高通滤波器
2 巴特沃思高通滤波器
3 高斯型高通滤波器
4 频率域的拉普拉斯算子
5 钝化模板、高频提升滤波和高频加强滤波
频率域图像增强处理的过程：

图像复原
试图利用退化过程的先验知识，去恢复已被退化图像的本来面目。图像复原[wq9] 的基本思路：先建立退化的数学模型，然后根据该模型对退化图像进行拟合。
图像复原模型可以用连续数学和离散数学处理，处理项的实现可在空间域卷积，或在频域相乘。
七、图像压缩
图像压缩是数据压缩技术在数字图像上的应用，它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩，这是因为有损压缩方法，尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像，例如一些应用中图像的微小损失是可以接受的（有时是无法感知的），这样就可以大幅度地减小位速。编码是压缩技术中最重要的方法，它在图像处理技术中是发展最早且比较成熟的技术。
无损图像压缩方法
A．行程长度编码
B．熵编码法
C．LZW算法
有损压缩方法
A．将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中，图像中的每个像素都用调色板中颜色索引表示。这种方法可以与抖动(en:dithering)一起使用以模糊颜色边界。
B．色度抽样，这利用了人眼对于亮度变化的敏感性远大于颜色变化，这样就可以将图像中的颜色信息减少一半甚至更多。
C．变换编码，这是最常用的方法。首先使用如离散余弦变换（DCT）或者小波变换这样的傅立叶相关变换，然后进行量化和用熵编码法压缩。
D．分形压缩（en:Fractal compression）。
八、图像分割
图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来，其有意义的特征有图像中的边缘、区域等，这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法，但还没有一种普遍适用于各种图像的有效方法。因此，对图像分割的研究还在不断深入之中，是目前图像处理中研究的热点之一。
通常图像分割的实现方法是，将图像分为“黑”、“白”两类，这两类分别代表了两个不同的对象。
图像分割方法：阈值分割、区域分割、数学形态学、模式识别方法
A．阈值分割包括以下几种：
（1）由直方图灰度分布选择阈值
（2）双峰法选择阈值
（3）迭代法选取阈值
原理如下，很好理解。
迭代法是基于逼近的思想，其步骤如下：
1．求出图像的最大灰度值和最小灰度值，分别记为ZMAX和ZMIN，令初始阈值T0=(ZMAX+ZMIN)/2；
2．根据阈值TK将图象分割为前景和背景，分别求出两者的平均灰度值ZO和ZB；
3．求出新阈值TK+1=(ZO+ZB)/2；
4．若TK=TK+1，则所得即为阈值；否则转2，迭代计算。
（4）大津法选择阈值[wq10]
大津法是属于最大类间方差法，它是自适应计算单阈值的简单高效方法，或者叫（Otsu）。大津法由大津于1979年提出，对图像Image，记t为前景与背景的分割阈值，前景点数占图像比例为w0，平均灰度为u0；背景点数占图像比例为w1，平均灰度为u1。图像的总平均灰度为：u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历t，当t使得值g=w0*(u0-u)2+w1*(u1-u)2最大时t即为分割的最佳阈值。对大津法可作如下理解：该式实际上就是类间方差值，阈值t分割出的前景和背景两部分构成了整幅图像，而前景取值u0，概率为 w0，背景取值u1，概率为w1，总均值为u，根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小，因此使类间方差最大的分割意味着错分概率最小。直接应用大津法计算量较大，因此一般采用了等价的公式g=w0*w1*(u0-u1)2。
（5）由灰度拉伸选择阈值
大津法是较通用的方法，但是它对两群物体在灰度不明显的情况下会丢失一些整体信息。因此为了解决这种现象采用灰度拉伸的增强大津法。在大津法的思想上增加灰度的级数来增强前两群物体的灰度差。对于原来的灰度级乘上同一个系数，从而扩大了图像灰度的级数。试验结果表明不同的拉伸系数，分割效果差别比较大。
B．区域的分割
区域生长、区域分离与合并
区域生长算法
C．基于形态学分水岭的分割
分水岭分割算法
九、图像特征提取与匹配[wq11]
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
A．颜色特征
特点：颜色特征是一种全局特征，描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征，此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感，所以颜色特征不能很好地捕捉图像中对象的局部特征。
常用的特征提取与匹配方法：
颜色直方图
其优点在于：它能简单描述一幅图像中颜色的全局分布，即不同色彩在整幅图像中所占的比例，特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于：它无法描述图像中颜色的局部分布及每种色彩所处的空间位置，即无法描述图像中的某一具体的对象或物体。
颜色直方图特征匹配方法：直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
B．纹理特征
纹理特征的提取方法比较简单，它是用一个活动的窗口在图像上连续滑动，分别计算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等，形成相应的纹理图像，当目标的光谱特性比较接近时，纹理特征对于区分目标可以起到积极的作用。选取适当的数据动态变化范围，进行纹理特征提取后，使影像的纹理特征得到突出，有利于提取构造信息。
特点：纹理特征也是一种全局特征，它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性，并不能完全反映出物体的本质属性，所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同，纹理特征不是基于像素点的特征，它需要在包含多个像素点的区域中进行统计计算。在模式匹配中，这种区域性的特征具有较大的优越性，不会由于局部的偏差而无法匹配成功。作为一种统计特征，纹理特征常具有旋转不变性，并且对于噪声有较强的抵抗能力。但是，纹理特征也有其缺点，一个很明显的缺点是当图像的分辨率变化的时候，所计算出来的纹理可能会有较大偏差。另外，由于有可能受到光照、反射情况的影响，从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
常用的特征提取与匹配方法：
纹理特征描述方法分类
（1）统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上，通过实验，得出灰度共生矩阵的四个关键特征：能量、惯量、熵和相关性。统计方法中另一种典型方法，则是从图像的自相关函数（即图像的能量谱函数）提取纹理特征，即通过对图像的能量谱函数的计算，提取纹理的粗细度及方向性等特征参数
（2）几何法
所谓几何法，是建立在纹理基元（基本的纹理元素）理论基础上的一种纹理特征分析方法。纹理基元理论认为，复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中，比较有影响的算法有两种：Voronio 棋盘格特征法和结构法。
（3）模型法
模型法以图像的构造模型为基础，采用模型的参数作为纹理特征。典型的方法是随机场模型法，如马尔可夫（Markov）随机场（MRF）模型法和 Gibbs 随机场模型法
（4）信号处理法
纹理特征的提取与匹配主要有：灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究，提出6种属性，即：粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型（simultaneousauto-regressive, SAR）是马尔可夫随机场（MRF）模型的一种应用实例。
C．形状特征
特点：各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索，但它们也有一些共同的问题。
常用的特征提取与匹配方法：
通常情况下，形状特征有两类表示方法，一类是轮廓特征，另一类是区域特征。图像的轮廓特征主要针对物体的外边界，而图像的区域特征则关系到整个形状区域。
几种典型的形状特征描述方法：
（1）边界特征法
该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法，其基本思想是点—线的对偶性；边界方向直方图法首先微分图像求得图像边缘，然后，做出关于边缘大小和方向的直方图，通常的方法是构造图像灰度梯度方向矩阵。
（2）傅里叶形状描述符法
傅里叶形状描述符(Fourier shapedescriptors)基本思想是用物体边界的傅里叶变换作为形状描述，利用区域边界的封闭性和周期性，将二维问题转化为一维问题。由边界点导出三种形状表达，分别是曲率函数、质心距离、复坐标函数。
（3）几何参数法
形状的表达和匹配采用更为简单的区域特征描述方法，例如采用有关形状定量测度（如矩、面积、周长等）的形状参数法（shape factor）。在 QBIC 系统中，便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数，进行基于形状特征的图像检索。
D．空间关系特征
特点：所谓空间关系，是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系，这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类：相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况，如上下左右关系等，后一种关系强调的是目标之间的距离大小以及方位。显而易见，由绝对空间位置可推出相对空间位置，但表达相对空间位置信息常比较简单。
空间关系特征的使用可加强对图像内容的描述区分能力，但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外，实际应用中，仅仅利用空间信息往往是不够的，不能有效准确地表达场景信息。为了检索，除使用空间关系特征外，还需要其它特征来配合。
常用的特征提取与匹配方法：
提取图像空间关系特征可以有两种方法：一种方法是首先对图像进行自动分割，划分出图像中所包含的对象或颜色区域，然后根据这些区域提取图像特征，并建立索引；另一种方法则简单地将图像均匀地划分为若干规则子块，然后对每个图像子块提取特征，并建立索引。
十、图像分类（识别）
图像分类（识别）属于模式识别的范畴，其主要内容是图像经过某些预处理（增强、复原、压缩）后，进行图像分割和特征提取，从而进行判决分类。图像分类常采用经典的模式识别方法，有统计模式分类和句法（结构）模式分类，近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
模式识别是一种从大量信息和数据出发，在专家经验和已有认识的基础上，利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段，即学习阶段和实现阶段，前者是对样本进行特征选择，寻找分类的规律，后者是根据分类规律对未知样本集进行分类和识别。广义的模式识别属计算机科学中智能模拟的研究范畴，内容非常广泛，包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。计算机模式识别实现了部分脑力劳动自动化。
模式识别－－对表征事物或现象的各种形式的（数值的，文字的和逻辑关系的）信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。
模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等，属于概念识别研究的范畴，是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、文字、符号、三位物体和景物以及各种可以用物理的、化学的、生物的传感器对对象进行测量的具体模式进行分类和辨识。
模式识别问题指的是对一系列过程或事件的分类与描述，具有某些相类似的性质的过程或事件就分为一类。模式识别问题一般可以应用以下4种方法进行分析处理。
模版比对：
统计模式识别方法：统计模式识别方法是受数学中的决策理论的启发而产生的一种识别方法，它一般假定被识别的对象或经过特征提取向量是符合一定分布规律的随机变量。其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中，这个空间包含了所有的特征向量，不同的特征向量，或者说不同类别的对象都对应于空间中的一点。在分类阶段，则利用统计决策的原理对特征空间进行划分，从而达到识别不同特征的对象的目的。统计模式识别中个应用的统计决策分类理论相对比较成熟，研究的重点是特征提取。统计模式识别的基本原理是：有相似性的样本在模式空间中互相接近，并形成“集团”，即“物以类聚”。其分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N)，将一个给定的模式归入C个类ω1,ω2,…,ωc中，然后根据模式之间的距离函数来判别分类。其中，T表示转置；N为样本点数；d为样本特征数。
统计模式识别的主要方法有：判别函数法，k近邻分类法，非线性映射法，特征分析法，主因子分析法等。
在统计模式识别中，贝叶斯决策规则从理论上解决了最优分类器的设计问题，但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习，是更简便有效的方法，因而获得了广泛的应用，但它是一种启发式技术，缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论——VC理论的建立，该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题，而且导出了一种新的学习方法——支撑向量机。
人工神经网络模式识别：人工神经网络的研究起源于对生物神经系统的研究。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解，具有一定的智能化处理的特点。
句法结构模式识别：又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合，子模式又可描述为更简单的子模式的组合，最终得到一个树形的结构描述，在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述，又要易于用非句法方法加以抽取。显然，基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述，称为模式描述语句，这相当于在语言中，句子和短语用词组合，词用字符组合一样。基元组合成模式的规则，由所谓语法来指定。一旦基元被鉴别，识别过程可通过句法分析进行，即分析给定的模式语句是否符合指定的语法，满足某类语法的即被分入该类。
在几种算法中，统计模式识别是最经典的分类识别方法，在图像模式识别中有着非常广泛的应用。

[wq1]
本文参考《数字图像处理》（第二版）
作者：冈萨雷斯
[wq2]
参考第二章，掌握概念？
[wq3]
线性变换：如果变换函数是线性的或是分段线性，这种变换就是线性变换。以线性函数加大图像的对比度的效果是使整幅图像的质量改善。以分段线性函数加大图像中某个（或某几个）亮度区间的对比度的效果是使局部亮度区间的质量得到改善。
非线性变换：当变换函数是非线性时，即为非线性变换。常用的有指数变换和对数变换。

[wq4]
参考《几种图像处理库的研究》：http://blog.csdn.net/byxdaz/article/details/3972293
[wq5]
以时间作为变量所进行的研究就是时域
以频率作为变量所进行的研究就是频域
以空间坐标作为变量进行的研究就是空间域
以波数作为变量所进行的研究称为波数域
[wq6]
一阶微分
[wq7]
二次导数，其离散实现类似于二阶Sobel导数
[wq8]
1）仿射变换
2）透视变换
[wq9]
参考
http://download.csdn.net/source/1513324
[wq10]
OTSU
[wq11]
SIFT特征怎么用？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像处理知识框架的相关文章

win10系统下安装Kafka 的详细步骤

Win10 系统下要使用Kafka需要经过以下三个步骤 1 安装JDK 需要安装依赖java JDK 2 安装zookeeper 资源协调分配管理 3 安装Kafka 一安装 Java SE Development Kit 13 0 1
【原创】ESXI6.7+ikuai爱快搭建软路由（非常详细）

ESXI安装过程我就直接跳过了这个网上教程多得是先介绍一下我的测试环境一台测试电脑CPU G5400 内存32G DDR4 硬盘960G的铠侠 SATA3接口的SSD 网卡自带的瑞昱8168网卡一块另外买的瑞昱8168网卡两条网
Linux常见命令整理

Linux 常用命令基本命令掌握磁盘命令 cd ll 文件夹文件创建命令 mkdir touch 文件浏览 less 文件全盘查找 find 文件操作 cp mv rm 文件编辑 vi 压缩解压 tar 权限命令其它命令最终安装
[Qt3d] 导出QtEntity为Obj格式（遍历QtEntity）

原文链接 https www yuque com softdev qt txv1lx class Qui3DView private struct date struct QPointer
java.awt.Color类

Color类概述 Color是用来封装颜色的支持多种颜色空间默认为RGB颜色空间每个Color对象都有一个alpha通道值为0到255 代表透明度当alpha通道值为255时表示完全不透明当alpha通道值为0时表示完全透明
Cordova环境搭建/win10下必备依赖环境配置（Android开发）

Cordova环境依赖 1 win10系统 2 Java环境 3 Node环境 4 AndroidStudio 5 Ant 6 Gradle 安装node环境 1 使用node官网网址下载node包最好使用稳定版本 https nodej
从C过渡到C ++的3个理由

几十年来嵌入式软件工程师之间一直在争论他们应该使用C还是C 根据2020年嵌入式市场调查在大多数情况下微控制器制造商提供的软件都以C语言提供实际上有56 的嵌入式软件是用C语言编写的但是 C 逐渐流行起来大约23 的新嵌入式软
Java面向对象编程

主机甲和乙已建立了TCP连接甲始终以MSS 1KB大小的段发送数据并一直有数据发送乙每收到一个数据段都会发出一个接收窗口为10KB的确认段若甲在t时刻发生超时时拥塞窗口为8KB 则从t时刻起不再发生超时的情况下经过10个RTT后
Ubuntu安装git

使用 apt get install git 安装git 报错这个错误信息通常表示您的系统上没有可用的 git 软件包这可能是因为您的软件源列表中没有包含 git 软件包所在的软件源或者您的软件源列表已经过期解决如果您使用的是 U
RuntimeError: Attempting to deserialize object on CUDA device 1 but torch.cuda.device_count() is 1.

成功解决 RuntimeError Attempting to deserialize object on CUDA device 1 but torch cuda device count is 1 报错内容程序在这一步报错 check
Android kotlin自定义自动换行LinearLayout

目录 1 概述 2 实现步骤 3 kotlin自定义自动换行LinearLayout核心代码实现功能 3 1自定义LinearLayout
spring快速入门

1 导入坐标
stack容器

stack容器 1 stack 基本概念概念 stack是一种先进后出 First In Last Out FILO 的数据结构它只有一个出口栈中只有顶端的元素才可以被外界使用因此栈不允许有遍历行为栈中进入数据称为入栈 push
dll load failed: 找不到指定的模块_【已解决】“由于找不到xinput1_3.dll,无法继续执行代码”...

许多小伙伴在玩游戏或者使用电脑的过程中电脑突然提示由于找不到xinput1 3 dll 无法继续执行代码导致游戏等程序无法正常启动运行并且导致电脑系统弹窗报错那xinput1 3 dll丢失怎么修复呢下面让小编手把手教你解决方法
CentOS7安装OpenStack(Liberty)

1 安装yum源 yum install https buildlogs centos org centos 7 cloud x86 64 openstack liberty centos release openstack liberty
百度智能云千帆大模型三连击：接入LLaMA2等33个模型、上线插件功能和103个Prompt模板

作为全球首个一站式企业级大模型平台百度智能云千帆大模型平台在提供包括文心一言在内的大模型服务及第三方大模型服务的同时还提供大模型开发和应用的整套工具链帮助企业解决大模型从训练到开发过程中的全链条问题自2023年3月发布以来千帆
看懂android中的adapter适配器

首先需要知道一共有4个文件 fragment类 adapter fragment的布局文件 adapter中的item的布局文件 1 首先声明一个控件 RecyclerView 2 然后声明一个adapter类 3 在initView 上
python中typeerror_详解python中的TypeError错误解决办法

新手在学习python时候会遇到很多的坑下面来具体说说其中一个在使用python编写面向对象的程序时新手可能遇到TypeError this constructor takes no arguments这个错误例如下面的程序 cl
gtest 单元测试工具的基本使用

gtest 单元测试 gtest 简介 gtest 优点安装 gtest 测试 demo 总结 gtest 简介 gtest是Google的一套用于编写C 测试的框架可以运行在很多平台上包括Linux Mac OS X Windows
获取时间和脸颊、下颚线灯模式

电流检测的应用电路检测电路常用于高压短路保护电机控制 DC DC换流器系统功耗管理二次电池的电流管理蓄电池管理等电流检测等场景对于大部分应用都是通过感测电阻两端的压降测量电流一般使用电流通过时的压降为数十mV 数百mV的电

随机推荐

android动画内存优化,Android 性能优化之内存优化

定义内存泄漏 Memory Leak 指程序在申请内存后当该内存不需再使用但却无法被释放的现象内存溢出 OOM 应用程序所需的内存超出了为其分配的内存限额 Android将进程分为5个优先等级前台进程可见进程服务进程后台进程
google.api.http

Http 定义api服务的http配置它包含一个httprule列表每个列表指定一个rpc方法到一个或多个http rest api方法的映射字段描述 rules HttpRule 一个适用于各个API方法的http配置规则列表注
编译优化之 - 向量化优化入门

1 介绍 2 Intel高级向量扩展 3 GCC中向量化 4 ICC中向量化 5 AOCC LLVM中向量化 1 介绍什么是自动向量化自动向量化 automatic vectorization 是自动并行化 automatic para
STM32笔记：高精度脉冲宽度计双输入捕获+DMA方式

本文介绍如何用STM32F107VC Waveshare Open107V实验板实现高精度的脉冲宽度计占空比开发环境 IDE STM32CubeIDE 1 8 固件库 STM32Cube FW F1 V1 8 4 函数发生 RIGOL
人工智能开源社区论坛----开源助力多领域AI生态发展

ChinaOSC 2022 人工智能开源社区论坛开源助力多领域AI生态发展技术论坛将于2022年8月20日13 00 17 00在陕西省西安高新国际会议中心召开本论坛将围绕开源社区助力多领域AI生态发展主题邀请AI开源领域顶级技术
Filco圣手二代键盘蓝牙连接方法

键盘前面的电源按钮按进去即打开电源开关同时按下Ctrl Alt Fn 看到蓝灯和红灯同时亮起之后剩蓝灯闪烁按下小键盘中数字键1 4中的一个一共可以连4台设备如果你选的数字之前连接过其他设备可以在第2步做完之后先按两秒清除按钮
托福综合写作套路

1 文章认定教授驳斥 2 The reading passage provides three possible functions of the carved stone balls However in the lecture the
决策树算法原理+例题练习

一决策树的优缺点优点计算复杂度不高输出结果易于理解对中间值的缺失值不敏感可以处理不相关特征数据缺点可能会产生过度匹配的问题使用数据类型数值型和标称型二一个实例一天老师问了个问题只根据头发和声音怎么判断一位同学的
LSF的使用方法总结

一 LSF 基本介绍 LSF Load Sharing Facility 是IBM旗下的一款分布式集群管理系统软件负责计算资源的管理和批处理作业的调度它给用户提供统一的集群资源访问接口让用户透明地访问整个集群资源同时提供了丰富的功能
5.19 华为算法笔试经验

华为机试一共三道题对应的分值分别为100分 200分 300分下面介绍这次笔试题目第一题一共有N个员工围成一个圆圈分别是1 2 N每一个员工身上有对应数量的令牌轮流从顺时针以及逆时针进行报数顺时针报数周期为R 逆时针报数周期为
僵尸进程的多种处理方式-图文详细教程

问题引起原因 yum更新导致无法使用yum 于是将占用进程kill掉导致 ps A ostat ppid pid cmd grep e Zz ps ef no headers k8s环境kubelet服务异常 systemd1服务超时导
IP地址和子网掩码详解

原文链接 IP和子网掩码我们都知道是由四段数字组成在此我们先来了解一下3类常用的 A类IP段 0 0 0 0 到127 255 255 255 B类IP段 128 0 0 0 到191 255 255 255 C类IP段 192 0
Android Studio连接Mysql数据库步骤以及常见错误

1 先把Mysql给下好环境变量也配置好这里我就不说了 2 下载好Navicat for Mysql软件管理数据库 3 进入Android Studio创建一个类写好连接数据库的代码我们采用的是常用的JDBC方法来连接需要的ja
JNI基础

问题1 JNI是什么答 JNI是Java语言的机制 Java可以通过JNI调用C C 代码 C C 代码也可以通过JNI调用Java代码问题2 NDK是什么答 NDK是代码库功能有两个 1 将 c cpp文件转换成 so文件 2 将
【产品笔记】3.产品经理实战

1 团队合作 2 产品设计到立项 3 项目启动到产品上线 4 产品上线后的运营产品商业模式功能设计技术内容产品的成功归功于整个团队的精诚合作产品的失败只归咎于产品负责人用户运营拉新留存老用户召回内容运营内容质量
Visual Studio 2017下载地址和安装教程（图解版）

Visual Studio 2017下载地址和安装教程图解版 Visual Studio 2017不仅支持C C Python Visual Basic Node js HTML JavaScript等各大编程语言还能开发 iOS An
华为OD机试真题-日志排序-2023年OD统一考试（B卷）

华为OD机试2023年最新题库 JAVA Python C 题目描述运维工程师采集到某产品现网运行一天产生的日志N条现需根据日志时间按时间先后顺序对日志进行排序日志时间格式为 H M S N H表示小时 0 23 M表示分钟 0 59
MOS管的知识，看这一篇就可以了

转载 21ic电子网 2020 11 15 18 19 以下文章来源于记得诚电子设计作者记得诚记得诚电子设计分享电子硬件知识永远相信美好的事情即将发生今天的文章简单总结一下MOS管如下是本文目录场效应管分类场效应管分为结型
虚拟机执行子程序-虚拟机字节码执行引擎

代码编译的结果从本地机器码转变为字节码是存储格式发展的一小步却是编程语言发展的一大步虚拟机执行子程序虚拟机字节码执行引擎一概述二运行时栈帧结构 1 局部变量表 2 操作数栈 3 动态连接 4 方法返回地址 5 附加信息三
图像处理知识框架

转自https blog csdn net hitwengqi article details 8292675 花了点时间整理了一下数字图像处理知识体系从宏观上把握图像处理使自己的学习思路就更加清晰 1 本文大部分内容来自 http b

图像处理知识框架

图像处理知识框架 的相关文章

随机推荐

热门标签

图像处理知识框架的相关文章