详解AdaBoost

2023-11-13

Boosting，顾名思义，这是一个增强算法，而它增强的对象，就是机器学习中我们所熟知的学习器。在Valiant引入的PAC（Probably Approximately Correct，又称可能近似正确）中，学习器可被分为强学习器和弱学习器。其中，在处理二分类问题时，弱学习器被视为只比随机分类更好一点（即准确率略高于0.5）的分类器，而强分类器的准确率在90%以上。但是强学习器的获取要比弱学习器困难得多，而1989年Kearns&Valiant¹提出了一个经典的理论问题：强可学习性和弱可学习性问题是否等价。如果该问题的答案是肯定的，那么就意味着所有的弱学习器都有被提升为强学习器的潜力。幸运的是，这问题答案在后来被Schapire证明是肯定的。由此，就有了弱学习器的增强过程。

Boosting的基本想法就是给样本赋权，利用权值改变纠正弱学习器的错误。每一轮都会加入新的弱学习器，每轮过后，都会生成一个新的样本分布，那些被分错的样本，其关注度会有所增加。T轮过后，将所有的分类器结合，形成性能提升巨大的强学习器。后来关于Boosting类算法的改进，基本上也都是基于改变调整样本权值和分类器结合方式来的。

输入：样本分布D；基学习算法L；学习轮数T； D 1 = D f o r t = , . . . T : h t = L ( D t ) ; ε t = P x ∽ D t ( h t ( x ) ≠ f ( x ) ) ; D t + 1 = A d j u s t _ D i s t r i b u t i o n ( D t , ε t ) . ⁣ e n d 输出： H ( x ) = C o m b i n e _ O u t p u t s ( { h 1 ( x ) , . . . , h t ( x ) } ) . \begin{gathered} \fbox{ 输入：样本分布D；基学习算法L；学习轮数T； }\\ D_1=D \\ for\enspace t=,...T:\qquad\\ h_t=L(D_t);\\ \qquad\qquad\qquad \varepsilon _t=P_{x\backsim D_t}(h_t(x)\ne\ f(x));\\ \qquad\qquad\qquad\qquad\qquad D_{t+1}=Adjust\_Distribution(D_t,\varepsilon _t).\\ \!end\qquad\qquad\qquad \\ \fbox{ 输出： }\\ H(x)=Combine\_Outputs(\{h_1(x),...,h_t(x)\}). \end{gathered} 输入：样本分布D；基学习算法L；学习轮数T； D1=Dfort=,...T:ht=L(Dt);εt=Px∽Dt(ht(x)= f(x));Dt+1=Adjust_Distribution(Dt,εt).end 输出： H(x)=Combine_Outputs({h1(x),...,ht(x)}).

在Boosting过程的基础上，Freund&Schapire²于1997年提出了Adaboost（Adaptive Boosting，又称自适应增强）算法，其经典版在2000年由Friedman³提出。

算法流程

输入训练数据集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ( x N , y N ) } D = \{ ( x_1 , y_1 ) , ( x_2 , y_2 ) , ( x _N , y_N ) \} D={(x1,y1),(x2,y2),(xN,yN)}其中， x i ∈ X , y i ∈ = − 1 , 1 x_i∈X,y_i∈=-1,1 xi∈X,yi∈=−1,1迭代总次数为T

1、初始化权重分布， D 1 = ( w 1 , 1 , w 1 , 2 , . . . , w 1 , i ) , w 1 , i = 1 N , i = 1 , 2 , . . . , N D_1=(w_{1,1},w_{1,2},...,w_{1,i}),w_{1,i}=\frac{1}{N},i=1,2,...,N D1=(w1,1,w1,2,...,w1,i),w1,i=N1,i=1,2,...,N
2、迭代t=1,2,…,T

a.在分布D_t下从D中训练分类器h_t(x)
b.计算分类器h_t的错误率 ε t = ∑ i = 1 N w t , i I ( h t ( x ) ≠ y i ) \varepsilon _t=\sum\limits_{i=1}^{N} w_{t,i}I\big(h_t(x)\ne y_i\big) εt=i=1∑Nwt,iI(ht(x)=yi)
c.计算h_t的权重 α t = 1 2 l n ( 1 − ε t ε t ) \alpha_t=\frac{1}{2}ln(\frac{1-\varepsilon_t}{\varepsilon_t}) αt=21ln(εt1−εt)
d.更新权重分布，其中Z_t为满足分布条件的归一化因子
w t + 1 , i = w t , i Z t e x p ( − α t y i h t ( x i ) ) w_{t+1,i}=\frac{w_{t,i}}{Z_t}exp\big(-\alpha_ty_ih_t(x_i)\big) wt+1,i=Ztwt,iexp(−αtyiht(xi))
Z t = ∑ i = 1 N w t , i e x p ( − α t y i h t ( x i ) ) Z_t= \sum\limits_{i=1}^{N}w_{t,i}exp(-\alpha_ty_ih_t(x_i)) Zt=i=1∑Nwt,iexp(−αtyiht(xi))
3、整合分类器 H ( x ) = s i g n ( ∑ i = 1 T α t h t ( x ) ) H(x)=sign\big(\sum\limits_{i=1}^{T}\alpha_th_t(x)\big) H(x)=sign(i=1∑Tαtht(x))
此方法是通过重赋值的策略，在每一轮根据相应的分布对训练样本赋权来完成的，而对于不能利用样本权值学习的算法，可以采用重采样的方法，即每一轮根据相应的分布对训练样本进行采样。
对于算法性能，经过证明，Adaboost最终的集成分类器的错误率存在着上界，同时，在迭代之中，错误率呈指数趋势减少，说明Adaboost在降低误差，将弱分类器训练整合为强学习器方面有着很好的表现。不过，这又引出一个问题，Adaboost会过拟合吗？答案是会的。Grove&Schuurmans⁴在1998年证明了在足够多轮之后，Adaboost也会过拟合，所以其只是在通常情况下不会过拟合。对于多少轮后会过拟合，Grove&Schuurmans提出了一个学习轮数T的上界。

存在问题

虽然Adaboost有着很好的泛化性能，但是由于其采用的是对样本重赋权来实现纠错，其对噪声很敏感。在学习噪声数据时，Adaboost仍然会尽力去拟合这些噪声，并且由于不断错误分类，还会使得噪声数据的权重不断加大，降低分类器预测能力。一个比较好的解决办法是直接为样本的权重设定一个上界，具体改进可参考Domingo&Watanabe⁵于2000年提出的MadaBoost算法。

多分类问题

以上讨论的是针对于二分类问题的Adaboost，以下我们开始讨论Adaboost在多分类问题中的应用。Adaboost在多分类问题上应用所面对的最大问题，便是对弱分类器的约束过强。在二分类问题中，我们对弱分类器的要求是其分类准确率要比0.5略大，但是在多分类中，1/N，N>2，这明显达不到要求。关于这一点，比较常用的解法是将多分类任务分解为多个二分类任务，包括有“一对其余”和“一对一”分解。“一对其余”就是将N类多分类任务分成N个二分类任务，第i个二分类任务仅判断其是否属于i类。代表算法有Schapire&Singer⁶的Adaboost.MH。“一对一”方法则将N个多分类任务分成N*(N-1)/2个二分类任务，第i个二分类任务仅判断其是属于第i类还是第j类。代表算法有Freund&Schapire的Adaboost.M2。

参考资料

Ehrenfeucht A, Haussler D, Kearns M, et al. A general lower bound on the number of examples needed for learning[J]. Information and Computation, 1989, 82(3): 247-261. ↩︎
Freund Y, Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of computer and system sciences, 1997, 55(1): 119-139. ↩︎
Friedman J, Hastie T, Tibshirani R. Special invited paper. additive logistic regression: A statistical view of boosting[J]. Annals of statistics, 2000: 337-374. ↩︎
Grove A J, Schuurmans D. Boosting in the limit: Maximizing the margin of learned ensembles[C]//AAAI/IAAI. 1998: 692-699. ↩︎
Domingo C, Watanabe O. MadaBoost: A modification of AdaBoost[C]//COLT. 2000: 180-189 ↩︎
Allwein E L, Schapire R E, Singer Y. Reducing multiclass to binary: A unifying approach for margin classifiers[J]. Journal of machine learning research, 2000, 1(Dec): 113-141. ↩︎

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

详解AdaBoost 的相关文章

MIT_线性代数笔记：复习二

目录第二单元主要内容例题第二单元主要内容正交矩阵 Q 用矩阵形式描述正交性质投影矩阵 P 最小二乘法在方程无解时求最优解 Gram Schmidt 正交化从任意一组基得到标准正交基策略是从向量中减去投影到其它向量方向的分
华为OD机试真题-字符串拼接-2023年OD统一考试（C卷）

题目描述给定M 0
华为OD机试真题-计算三叉搜索树的高度-2023年OD统一考试（C卷）

题目描述定义构造三叉搜索树规则如下每个节点都存有一个数当插入一个新的数时从根节点向下寻找直到找到一个合适的空节点插入查找的规则是 1 如果数小于节点的数减去500 则将数插入节点的左子树 2 如果数大于节点的数加上500 则将数
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
华为OD机试2024年最新题库（Python）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 Python解法
矩阵基本操作3

题目描述问题描述定义一个N M N M lt 100 的矩阵将一个该矩阵的行和列的元素互换存到另一个二维数组中输入格式一行两个整数 N M 中间用空格隔开表示矩阵有N行 M列接下来共N行M列表示矩阵输出格式输出转置以后的
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
用栈实现队列（OJ中报错的处理）

用栈实现队列 ERROR AddressSanitizer myQueueFree函数中栈的释放处现了问题没有调用StackDestory而是直接free了这个是栈初始化时 capacity与malloc申请的空间大小没有匹配请你仅使
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
2024年华为OD机试真题-虚拟游戏理财-Python-OD统一考试（C卷）

题目描述在一款虚拟游戏中生活你必须进行投资以增强在虚拟游戏中的资产以免被淘汰出局现有一家Bank 它提供有若干理财产品m 风险及投资回报不同你有N 元进行投资能接受的总风险值为X 你要在可接受范围内选择最优的投资方式获得最大回报
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
最大流-Dinic算法，原理详解，四大优化，详细代码

文章目录零前言一概念回顾可略过 1 1流网络 1 2流 1 3最大流 1 4残留网络 1 5增广路

随机推荐

java详解动态代理中的代理对象

相信大家都使用过动态代理就算没有写过应该也用过Spring来做过Bean的组织管理如果使用过Spring 那大多数情况应该已经不知不觉地用到动态代理了动态代理中所说的动态是针对使用Java代码实际编写了代理类的静态代理而言的
sql和MySQL的语句执行顺序

sql和mysql执行顺序发现内部机制是一样的最大区别是在别名的引用上一 sql执行顺序 1 from 3 join 2 on 4 where 5 group by 开始使用select中的别名后面的语句中都可以使用 6 avg s
Linux软件安装-rpm详解

Linux软件安装 rpm详解在Linux系统中 RPM Red Hat Package Manager 是一种常见的软件包管理器提供了方便的软件安装升级和卸载功能本文将详细介绍rpm的语法实操和各种方法之间的区别及重点内容 RP
Mysql8.0.16在win10的安装以及navicat连接

Mysql8 0 16在win10的安装以及navicat连接一安装过程 1 去mysql官网下载适合自己电脑的版本https www mysql com downloads 进入官网官网下载极慢建议下载个迅雷复制链接到迅雷体验
拥抱数字经济商用终端成为企业“必需品”

随着各行业数字化转型进程的不断推进英特尔作为商用终端领域的领路人将继续联手生态伙伴推动商用领域生产工具的变革赋能广大企业机构用户最终实现业务创新和产业升级助力中国经济高质量发展和数字中国建设作者贾贵鹏来源天极网近年来
Uboot启动参数说明

29 Uboot 启动参数说明 bootcmd cp b 0xc4200000 0x7fc0 0x200000 bootm 倒计时到 0 以后自动执行的指令 bootdelay 2 baudrate 38400 串口波特率一般使用 38
Springboot实现MQTT通信

目录一 MQTT简介 1 MQTT协议 2 MQTT协议特点二 MQTT服务器搭建三使用Springboot整合MQTT协议 1 在父工程下创建一个Springboot项目作为消息的提供者 1 1 导入依赖包 1 2 修改配置文件
vue3 的 ref、 toRef 、 toRefs

1 ref 对原始数据进行拷贝当修改 ref 响应式数据的时候模版中引用 ref 响应式数据的视图处会发生改变但原始数据不会发生改变
同行评审

在IBM 微软等很多公司都有一个很好的实践那就是代码复审这种代码审查的过程不是将代码发给某一个人或某几个人去看而是强调程序员自己定期走上台向其他人讲解自己源程序的活动因为要向大家讲解自己的程序程序员会极其重视自己的工作进度代
SeleniumLibrary4.5.0 关键字详解（九）

SeleniumLibrary4 5 0 关键字详解九库版本 4 5 0 库范围全局命名参数受支持简介 SeleniumLibrary是Robot Framework的Web测试库本文档说明了如何使用SeleniumLibra
linux安装rz、sz上传下载文件工具

在centos版本linux系统中执行如下命令 yum install lrzsz 如下图所以即可安装成功
windows 7编辑启动选项

问题开机之后提示编辑启动选项路径 windows system32 winload exe 分区 1 硬盘 f3c3f39 NOEXECUTE OPTIN 如图解决步骤 1 按回车键进入操作系统之后查看启动项配置 msconfi
自定义ZoomRecyclerView可缩放可点击

可直接使用喔 public class PinchRecyclerView extends RecyclerView implements View OnTouchListener private static final int INVA
html网页效果跳动的心

跳动的心代码用到了css的轮廓动画效果
使用Eclipse Babel语言包汉化eclipse

eclipse下载下来是默认是英文版的在eclipse的设置里似乎不能直接更改eclipse的语言文字我想把eclipse改成中文版我发现在官网上有个叫Eclispe Babel的可以更改Eclipse的语言这是一个多国语言包可以
2.7-3 Android Studio 的Gradle一点理解, 查看gradle 版本和android 插件的版本

参考 https developer android com studio releases gradle plugin html gradle 最大的优点就是对依赖管理的强力支持查看gradle 版本和android 插件的版本 Fil
Kubernetes 101，第一部分，基础知识

已经有一段时间了我想花点时间坐下来写写关于Kubernetes 的文章时机已到简而言之 Kubernetes是一个用于自动化和管理容器化应用程序的开源系统 Kubernetes 就是关于容器的如果你对什么是容器不太了解请先参考我的
函数模板，重载函数模板，模板的显式具体化，实例化

目录一函数模板应用场景二函数模板 1 直白理解函数模板函数模板就是建立一个通用的函数其参数类型和返回类型不具体指定用一个虚拟的类型来代表 2 函数模板的声明 3 函数模板的代码三重载的模板 1 为什么要使用重载模板 2 代
H5静态页面跳转微信小程序；从外部浏览器，点击H5链接跳转打开微信小程序；以及在微信内直接点击H5链接打开微信小程序；

参考链接需求从外部浏览器点击H5链接跳转打开微信小程序以及在微信内直接点击H5链接打开微信小程序步骤1 小程序开发需要使用云开发创建项目使用云开发生成的项目会自带云函数文件夹步骤2 项目开启云开发步骤3 下载官方的H5静态h
详解AdaBoost

Boosting 顾名思义这是一个增强算法而它增强的对象就是机器学习中我们所熟知的学习器在Valiant引入的PAC Probably Approximately Correct 又称可能近似正确中学习器可被分为强学习器和弱学习