图像典型特征描述子Haar

2023-05-16

以下文章摘录自：

《机器学习观止——核心原理与实践》

京东： https://item.jd.com/13166960.html

当当：http://product.dangdang.com/29218274.html

(由于博客系统问题，部分公式、图片和格式有可能存在显示问题，请参阅原书了解详情)

1.1.1 Haar-like feature

Haar-like最早应该可以追溯到1998年Papageorgiou等人发表的《A General Framework for Object Detection》中。据悉“Haar-like”这个名称，是因为它和“Haar wavelet”比较类似而得名的。

图 ‑ 一些基础的Haar-like特征

另外，后来业界有不少人也对Haar-like做了进一步分析和扩展，例如R.Lienhart等人在《An extended set of Haar-like features for rapid object detection》中将特征扩展到了14个;Paul Viola和Michael Jones则于2001年的论文《Rapid Object Detection using a Boosted Cascade of Simple Features》中提出了积分图计算的概念等等。

图 ‑ 一些扩展的Haar-like特征

接下来我们分别介绍Haar-like的特征提取，特征数量计算，积分图以及Adaboost等，它们都是我们理解Haar-like的核心基础。

1.1.1.1 Haar-like特征提取

Haar-like特征提取算法的处理过程并不复杂，核心思想就是：

特征值= 将feature中黑色部分的所有像素值之和 - 白色部分所有像素值之和

另外，计算特征值时还需要考虑增加一定的权重，以抵消黑白区域的像素值数量差异。例如下面所示的feature:

因为黑色部分的像素点只有白色部分的一半，所以特征值计算公式就要变成：

特征值= 将feature中黑色部分的所有像素值之和*2 - 白色部分所有像素值之和

在实际执行过程中：

l 每个feature是要在原图像上做窗口滑动的，步进为1

l 窗口在宽度或长度上会成比例的放大，然后再次执行上述的滑动操作，直到最后一个比例结束

不难理解，窗口可以放大的最大比例(宽和高)是：

以及

其中wI和hI是整个图像的宽和高，而wwin和hwin是Haar特征的原始宽和高的值。因为我们需要以不同的窗口大小来提取图像特征，这样一来无疑会增加Haar特征的计算量(通常会达到160000+次)。所以如何识别出重复的计算过程，从而有效减少计算量就成为Haar需要重点解决的问题之一了。

1.1.1.2 Haar特征数量

假设：

l 子窗口大小为m*m

l 特征窗口的左上顶点为A(x1,y1)，右下顶点为B(x2, y2)

l 并且上述特征窗口满足(s, t)条件：

n 它的x方向可以被自然数s整除

n 它的y方向可以被自然数t整除

换句话说，特征窗口的最小尺寸为s*t(也就是倍数为1时)，最大尺寸为：

[m/s]*s x [m/t]*t，其中[]表示整除运算符

对于左上角顶点A，它的取值范围如下所示：

对于右下角顶点B，它的取值范围如下所示：

其中：

这样一来，一个m*m子窗口中，所有满足(s,t)条件的特征窗口的数量为：

举例来说，对于一个24*24大小的子窗口，它在如下几种特征模板下的数量分别为：

l (s,t) = (1, 2)

这种特征模板形状如下：

根据前面计算公式，其数量为43200

l (s,t) = (1, 3)

这种特征模板形状如下：

根据前面计算公式，其数量为27600

l (s,t) = (3, 1)

这种特征模板形状如下：

根据前面的计算公式，其数量为27600

1.1.1.3 积分图

前面我们指出了Haar可能会需要大量的计算操作，因而如何降低计算量是其中的一个关键因素。积分图(Integral Image)就是用于解决这个问题的，它来源于《Rapid object detection using a boosted cascade of simple features》这篇paper。

积分图的基本思想不算太复杂，其实就是将可能会被多次用到的计算结果保存起来，以便减少重复计算的过程。具体来讲，就是把图像从原点到其它各个点所形成的矩形区域内的所有像素之和保存到数组中，后续计算Haar时可以直接查找数组得到像素和，从而达到加速的目的。

参考公式如下所示：

以下面的范例来说：

图 ‑ 积分图计算范例

我们如何计算D区域的像素和呢？

以前的办法，就是将D区域内的所有像素值都相加一遍，得到结果——利用积分图则可以降低计算复杂度。

接下来我们讲解一下具体的计算过程。

根据积分图的定义可知，保存到数组中的矩形框应该都是从原点出发的。所以如果我们假设：

A + B + C + D = E

A + B = F

A + C = G

那么不难理解E、F和G都是可以直接从积分图中查询得到的。

因而：

D = E - F - G + A

换句话说，借助于积分图我们只需要简单的几次加减法就可以得到像素求和结果了，从而大大降低了Haar的计算量。

1.1.1.4 AdaBoost

我们通过前面的步骤，已经可以获取到非常多的特征值了，但是它们之间多数是没有相关性(irrelevant)的。以下面的图示为例：

图 ‑ 特征非相关性图例

上半部分是两个特征，左下角是输入图像，右下角则是我们提取特征时的效果图。对于第一个feature，它可以匹配出“人眼比鼻子和脸颊颜色更深”的人脸特点;同理第二个feature，则可以表达“两只眼睛比鼻梁颜色更深”的另一个人脸特点——但这里有一个前提条件，即它们都需要在图像的合适位置时才能发挥作用。

那么我们怎么知道成千上万的features中哪些才是最佳的呢？

这就是Adaboost的“用武之地”了。

当然，AdaBoost本身是一种比较通用的分类器提升算法，而非Haar的“专属利器”。简单来讲，AdaBoost可以帮助Haar在“特征组合选择”上做得更好。

如果从历史渊源的角度来看，AdaBoost实际上是一种自适应的Boosting算法——后者的鼻祖则是L.G.VALIANT，他于1984年发表了一篇名为《A theory of the Learnable》的论文，揭开了Booting领域几十年的发展历程。

图 ‑ A theory of the Learnable

Boosting算法的理论基础是PAC(Probably Approximately Correct)，它是综合考虑了样本复杂度和计算复杂度情况下的一个学习框架。在Valiant提出的Boosting原始算法中，涉及到两个基础概念，即：

l 弱学习

这种学习算法的识别率较弱，只比随机识别好一点

l 强学习

这种学习算法的识别率很强

Michael J. Kearns等人在《The Computational Complexity of Machine Learning》中提出了弱学习和强学习等价的观点，并证明了在数据量足够的条件下，弱学习算法能够通过集成手段生成任意高识别率的强学习算法。

由Freund和Schapire等人提出的Adaboost算法，可以说是对Boosting算法的一大提升。为什么这么说呢？Adaboost是“Adaptive Boosting”的缩写——Adaptive译为“适应性地”，具体而言就是它可以根据弱学习的结果自适应地调整假设的错误率，所以Adaboost不需要预先知道假设的错误率下限。换句话说，它不需要任何关于弱学习器性能的先验知识，而且和Boosting算法具有同样的效率。

具体来讲，Adaboost针对传统boost算法的如下两个问题提出了新的思路：

l 面向同一个训练集，如何做到重复训练的目的

Adaboost会结合每一轮训练出的模型的分类结果，来调整样本的权重(比如本次分类出错的样本，我们在权重上要有相应的侧重，以便下一次训练时可以对它进行“重点关注”)，以实现同一训练集达到不同样本分布的目的

l 弱分类器如何有机组合，达到更好的效果

Adaboost中采用加权表决的方法来组合弱分类器——简单而言就是分类精度越高的弱分类器，其“话语权”越大，以此来将它们组成更加优秀的强分类器

我们参考《Rapid Object Detection using a Boosted Cascade of Simple Features》中对AdaBoost算法的伪代码描述，如下所示：

最终的强分类器表达如下：

简单来讲，其核心思想就是：

l 给定一个数据样本集S(包含n个样本)，它的初始样本权重为1/n。我们训练得到第一个弱分类器

l 针对第一个弱分类器分错的样本，调整它们的样本权重，然后重新训练得到第二个弱分类器

l 经过T个弱分类器后，按照权重叠加，得到最终的强分类器

借助于Adaboost，我们就可以结合Haar-like特征来构建出强大的分类器了——它们二者的组合，在行人检测和人脸识别方向上有广泛应用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像典型特征描述子Haar 的相关文章

ISP、IAP、ICP、JTAG、SWD的编程特点！种编程方式区别总结

转载自 xff1a http www eeskill com article id 38434 http bbs ic37 com bbsview 33838 htm 电子工程师都知道 xff0c 半导体技术发展迅猛 xff0c 带动了各种
OpenMP 参考（指令详解）

OpenMP 参考 xff08 指令详解 xff09 翻译 2011年03月21日 17 53 00 标签 xff1a parallel fortran newline list integer 工作 9866 编辑删除共享工作 xff
yum install brctl报错

安装brctl xff0c 如果使用下面命令会报错 xff0c 找不到包 yum install brctl 实际应该执行下面的命令 y 表示全部问题自动回答为是 yum install bridge utils y
喵小依踩奶篇

从刚来到现在 xff0c 喵小依踩奶奶的瞬间不甚枚举 xff0c 归纳总结 xff0c 大多出自以下几个意图 xff1a 1 xff0c 喵小依初来咋到时 xff0c 总会一个人出神的抱着自己的小毯子踩奶奶 xff0c 可能是在怀念呆
centos下终端分辨率

有时候 xff0c 终端分辨率不适合 xff0c 需要修改 xff0c 尤其是虚拟机的时候在 boot grub grub conf中 kernel 这行增加 vga 61 ask 重启 xff0c 就出现询问要那种显示模式 xff0c
Linux：备份你的工作和系统

1 xff0c 备份工具 xff1a dump span class token comment 使用dump备份 xff0c 会将原有设备上的数据覆盖掉 span dump 0u f dev nst0 web span class tok
Linux：用户与用户组管理

添加用户用户组场景 xff1a john的电脑丢了 xff0c 想借你的电脑用几天 xff0c 但是你的电脑里有一些私人文件不想让john看到 xff0c 于是乎 xff0c 你决定给john建立一个账号 xff1a span clas
Linux：/etc/passwd文件

待更新
赤池信息量准则（Akaike Information Criterion）

赤池信息量准则
tensorflow命令行参数：tf.app.flags.DEFINE_string、tf.app.flags.DEFINE_integer、tf.app.flags.DEFINE_boolean

tensorflow命令行参数 xff1a tf app flags DEFINE string tf app flags DEFINE integer tf app flags DEFINE boolean
***chapter 17 看图说话：将图像转换为文字

所谓Image Caption xff0c 是指从图片中自动生成一段描述性文字 xff0c 类似于看图说话本章主要介绍2个内容 xff1a 1 xff09 Image Caption的技术原理 xff1b 2 xff09 Image C
标准差（Standard Deviation）和标准误差（Standard Error）

点击打开 xff1a 标准差 xff08 Standard Deviation xff09 和标准误差 xff08 Standard Error xff09
R-squared 和 Adjusted R-squared 的区别

如果在现有model中 xff0c 再加入一个无关自变量 xff0c 则R squared的值仍然会增加 xff0c 但是 xff0c 实质上 xff0c model的拟合度并未增加 xff1b 为了弥补R suqared的缺陷 xff0
pip install出错： EnvironmentError:[WinError 5]拒绝访问

参考博文 xff1a python的pip10 1版本出现了安装包时的错误Could not install packages due to anEnvironmentError WinError 5 拒绝访问
UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 23: illegal multibyte se

参考博文 xff1a python读取中编码错误 xff08 illegal multibyte sequence xff09
vmware conveter5的使用操作指导-加上我的实验记录

实验内容 xff1a 源物理机 xff1a centos5 5 目标主机 xff1a esxi5 5 xff0c vcenter server5 5 converter xff1a 5 5 2 过程记录 xff1a 1 前几次向vcente
ros2遇到的问题和解决方法-----win10安装ros2_dashing

1 win10安装ros2 dashing可参考官方网站提供的安装方法https index ros org doc ros2 Installation Dashing Windows Install Binary 2 在下载安装的时候会很
华为笔试算法：清一色胡牌问题（java）

题目描述 xff1a 清一色是麻将番种之一 xff0c 指由一种花色的序数牌组成的和牌数字1 9 xff0c 每个数字最多有4张牌我们不考虑具体花色 xff0c 我们只看数字组合刻子 xff1a 三张一样的牌 xff1b 如 111
一知半见的oracle表函数

一知半见的oracle表函数 xff0c 管道化表函数 xff0c 好用于ETL xff0c 主要关键是 xff0c 可以在抽取过程中 xff0c 对数据进行转换来自 ITPUB博客 xff0c 链接 xff1a http blog it
October 15th 模拟赛A T2 NOIP2018五校联考黑暗之魂 Solution

题目空降 Description oi juruo热爱一款名叫黑暗之魂的游戏在这个游戏中玩家要操纵一名有点生命值的无火的余灰在一张地图中探险地图中有n个篝火 xff08 也就是存档点 xff09 在篝火处休息可以将生命值恢复满每个篝

随机推荐

AI视觉对抗之隐身T恤「AI前沿」

关注 xff1a 决策智能与机器学习 xff0c 深耕AI脱水干货作者许凯第来源 ECCV 2020 报道机器之心基于 AI 目标检测系统生成的对抗样本可以使穿戴者面对摄像头隐身由美国东北大学林雪研究组 xff0c MIT I
AI算法对抗攻击和防御技术综述「AI核心算法」

关注 xff1a 决策智能与机器学习 xff0c 深耕AI脱水干货作者任奎报道中国人工智能学会随着计算机产业发展带来的计算性能与处理能力的大幅提高 xff0c 人工智能在音视频识别自然语言处理和博弈论等领域得到了广泛应用在此背
AbstractQueuedSynchronizer源码详细分析【CLH队列】

AQS是JUC锁框架中最重要的类 xff0c 通过它来实现独占锁和共享锁的本章是对AbstractQueuedSynchronizer源码的完全解析 xff0c 分为四个部分介绍 xff1a CLH队列即同步队列 xff1a 储存着所有等
【Zipkin】zipkin-dependencies计算 - 源码解析

zipkin dependencies离线计算拓扑图依赖本文分析mysql存储 xff08 后续准备接入Doris直接计算依赖关系 xff0c 所以分析不关注存储 xff09 查找main方法 ZipkinDependenciesJob
为什么同一服务有的机器内存使用率高，有的内存使用率较低？读kafka

背景 xff1a 一个服务6台实例 xff0c 4台内存使用率较低 xff0c 另外2台使用率较高 xff0c 导致出现一些问题 xff0c 该服务为zipkin server服务 xff0c 收集从kafka传入的数据 xff0c 并进行
zuul1网关zuulFallBackProvider无效问题

这种方式只适用于eureka xff0c 不适用于url方式
新建JSP无法运行出现错误The superclass "javax.servlet.http.HttpServlet" was not found on the Java Build Pat解决办法

通常新建立一个JSP文件会出现一个 The superclass 34 javax servlet http HttpServlet 34 was not found on the Java Build Path 的错误导致整个JSP页面不
Eclipse中JDK版本切换

此文章适用于服务器jdk版本过低 xff0c 开发时jdk版本选择过高的解决办法右键项目propeties Project facets 此时更改JDK版本已经完成 xff0c 但是可能会出现一个错误 xff0c 项目名字前面有错误 xf
Hadoop五大守护进程的三种启动与关闭方式

Hadoop五大守护进程的三种启动与关闭方式第一种启动方式 xff1a 进入 Hadoop 1 x bin 目录 xff0c 执行start all sh xff0c JPS查看进程 xff0c 全部启动成功 19043 NameNode
正则表达式

笔记 xff1a 1 缩写表示取相反 xff0c 但是必须要在开头的地方才行 xff0c 结尾只代表自己 xff0c 0 9之间的 39 39 符号 xff0c 代表范围 xff0c 但是不在里面的 xff0c 也就是号任意一边是空的
HIVE分区表指定location加载不到数据解决方案

指定了表的location但是select不出来数据 xff0c 而目录确实存在hdfs上 xff0c 如图所示 xff08 我这里面是2级分区 xff09 解决方案 xff1a 1 Alter table test6 add partit
LINUX SHELL遍历日期（指定输入两个日期）

LINUX SHELL遍历日期 xff0c 昨天写一个让我删了 xff0c 写的也太坑了 xff0c 很简单的东西墨迹那么长一串羞愧不已 xff01 bin bash first 61 1 second 61 2 while 34 firs
虚拟机文件过多，如何删除？vmdk文件能删除吗？

最近发现虚拟机使用一段时间后产生了很多文件 xff0c 不知道哪些文件有用还是没有用 xff1f 能否直接删除 xff1f 有没有高手能告诉我一下 xff1f 其中很多是 vmdk文件 xff0c 看看前面的部分能否删除 xff1f
【直观理解】为什么梯度的负方向是局部下降最快的方向？

推荐阅读时间 xff1a 8min 15min 主要内容 xff1a 为什么梯度的负方向是局部下降最快的方向 xff1f 刚接触梯度下降这个概念的时候 xff0c 是在学习机器学习算法的时候 xff0c 很多训练算法用的就是梯度下降 xff
RichEdit扩展控件–ekRichEdit简介

原文地址 xff1a http www uieasy com cn blog p 61 419 易酷软件发布了RichEdit扩展控件ekRichEdit 此版本实现了在IM等聊天窗口中所需要的基本功能 xff0c 可以满足IM软件对Ric
如何选择VC界面库产品

客户经常来信询问该如何选择界面库产品 xff1a 你们的产品跟其他同类产品相比有什么优势 xff1f 你们的DSkinLite界面库跟DirectUI界面库有什么不同 xff0c 哪个产品更适合我们公司 xff1f 在此我们对这些问题做详细
游戏大厅类软件 Demo系列（二）

游戏大厅类软件 DSkinLite界面库Demo系列 xff08 二 xff09 游戏大厅类软件是UIEASY开发团队制作的又一个软件demo xff0c 此次发布只是一个雏形 xff0c 我们还将继续完善此Demo xff0c 使其各项功
窗口控件透明效果的实现--DSkinLite界面库使用技巧

DSkinLite 界面库使用技巧二窗口控件透明效果界面设计中 xff0c 很多效果需要借助透明效果来实现不幸的是 xff0c Windows 标准控件基本不支持透明效果因此我们需要自己来实现透明效果一般来说所谓控件透明 xff
DSkinControl( For MFC) 控件- dsCtrlComboBox

原文地址 xff1a http www uieasy cn blog p 61 513 传统的combobox 在使用方面有很多限制 xff0c 很难满足我们combobox类型控件的需求主要表现中combobox内置的listbox难以
图像典型特征描述子Haar

以下文章摘录自 xff1a 机器学习观止核心原理与实践京东 xff1a https item jd com 13166960 html 当当 xff1a http product dangdang com 29218274 html 由

图像典型特征描述子Haar

图像典型特征描述子Haar 的相关文章

随机推荐

热门标签