集成学习（Ensemble Learning）

2023-05-16

集成学习Ensemble Learning

Ensemble Learning
- Definition
- Common types of ensembles
- - Bootstrap aggregating (Bagging)
  - Boosting
  - Stacking
- Bagging，Boosting的主要区别[^1]

Ensemble Learning

Definition

周志华对集成学习的定义：Ensemble Learning
“Ensemble learning is a machine learning paradigm where multiple learners are trained to solve the same problem. In contrast to ordinary machine learning approaches which try to learn one hypothesis from training data, ensemble methods try to construct a set of hypotheses and combine them to use.”
集成学习是一种基于多个训练器的结果获得最终结果的模型。比如随机森林模型就是一种典型的集成学习的方法。在随机森林中，构建n课树，根据所有树的结果获得最终的结果。
集成学习是一种有监督学习（supervised learning）

Common types of ensembles

集成学习的种类很多，这里只介绍三种最常见的类型，分别为Bagging，Boosting和Stacking。很多集成学习其实是这几种方法的变形，比如随机森林算法就是一种基于bagging的机器学习算法。

Bootstrap aggregating (Bagging)

bagging是一种又放回抽样的集成模型构建方法。典型的例子为随机森林模型。因为每次抽样都是独立的，所以可以实现并行运行。

从原始样本集中重复抽样n次（有放回的抽样），获得n个训练样本，样本之间是独立的
针对每个训练样本，计算统计量T
基于n个统计量T，计算出统计量的估计值和置信区间

Boosting

boosting是一种提升方法，每次训练时都会更加关注上一次训练中分类错误的模型。因此被认为是一种迭代的方法，每一步迭代都是一个弱分类器。与Bagging相比，Boosting的方法可能存在更大的过拟合的风险。

Stacking

Stacking是一种整合多种算法预测值结果的算法。比如Stacking算法可以结合Bagging和Boosting的结果。一般来说，Stacking具有比单一算法更好的结果。它适用于监督学习和非监督学习。

Bagging，Boosting的主要区别¹

样本选择上：Bagging采用的是Bootstrap随机有放回抽样；而Boosting每一轮的训练集是不变的，改变的只是每一个样本的权重。
样本权重：Bagging使用的是均匀取样，每个样本权重相等；Boosting根据错误率调整样本权重，错误率越大的样本权重越大。
预测函数：Bagging所有的预测函数的权重相等；Boosting中误差越小的预测函数其权重越大。
并行计算：Bagging各个预测函数可以并行生成；Boosting各个预测函数必须按顺序迭代生成。

作者：shjyoudp, 来源：CSDN, 原文：https://blog.csdn.net/qq547276542/article/details/78304454 ↩︎

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

集成学习（Ensemble Learning）的相关文章

梯度下降方法中的学习率(learning rate), 衰减因子(decay) 冲量(momentum)

本文总结自如下两个链接的内容 xff0c 建议读者直接阅读链接中的文章 1 https www jianshu com p 58b3fe300ecb 2 https www jianshu com p d8222a84613c 学习率学习
自监督模型 Self-supervised learning（李宏毅2022

这个红色的怪物叫做ELMo 最早的self supervised learning model 作业四的模型也是个transformer xff0c 只有0 1个million 最早的是ELMo Cookie Monster等你来凑 x1f
[深度学习]note for Machine Learning: An Algorithmic Perspective, Second Edition（Ch01-Ch03）【部分勘误+代码待补充】

Machine Learning An Algorithmic Perspective Second Edition Part 1 1 绪论1 1 如果数据有质量 xff0c 地球将成为黑洞1 2 学习1 2 1 机器学习 1 3 机器学习
[深度学习]note for Machine Learning: An Algorithmic Perspective, Second Edition（Ch04-Ch06）【日常更新】

Machine Learning An Algorithmic Perspective Second Edition Part 2 4 多层感知器4 1 前向4 1 1 偏置 4 2 后向 xff1a 误差的反向传播4 2 1 多层感知器算
[翻译]Learning Deep Features for Discriminative Localization

英文原文请点这里摘要在这项工作中 xff0c 我们重新审视了 Network in network 中提出的全局平均池化层 xff08 global average pooling xff09 xff0c 并阐明了它是如何通过图片标签
【论文阅读】Learning Deep Features for Discriminative Localization

Abstract 研究了全局平均池化 global average pooling GAP xff0c 分析了它如何仅仅使用图像级标签训练就能使CNN具有出色的定位能力 localization ability 作者发现 xff0c 尽管G
Deep Learning Notes: Chapter 1 Introduction

前言最近开始读 Deep Learning 一书这让我有了一个边读书边写笔记的动机 xff1a 能够让人很轻松流畅的把握住这本书的脉络 xff0c 从而读懂这本书的核心内容由于终究是英文表达更地道 xff0c 因此该笔记都是节选自书中
Three scenarios for continual learning

Three scenarios for continual learning Standard artificial neural networks suffer from the well known issue of catastrop
《论文阅读01》Learning multiview 3D point cloud registration

目录一论文二论文概要三论文详述一论文研究领域 xff1a 点云配准论文 xff1a Learning multiview 3D point cloud registrationCVPR 2020论文链接二论文概要该论
Deep Learning 最优化方法之Adam

本文是Deep Learning 之最优化方法系列文章的Adam方法主要参考Deep Learning 一书整个优化系列文章列表 xff1a Deep Learning 之最优化方法 Deep Learning 最优化方法之SGD
自监督学习（self-supervised learning）（20201124）

看论文总是会看出来一堆堆奇奇怪怪的名词从远程监督有监督半监督无监督开始 xff0c 最近又看到了一个自监督首先先对上面的概念进行简述 xff1a 半监督 xff08 semi supervised learning xff09 x
ICRA2020论文整理（SLAM + Deep Learning）

参考 https github com PaoPaoRobot ICRA2020 paper list 目录 1 SLAM 2 Deep Learning in Robotics and Automation 3 Localization
常用网络协议神图
[ 对比学习篇 ] 经典网络模型 —— Contrastive Learning

Author Horizon Max 编程技巧篇各种操作小结神经网络篇经典网络模型算法篇再忙也别忘了 LeetCode 对比学习篇经典网络模型 Contrastive Learning 01 InstDisc 结构框图详解效
redis命令，SpringBoot整合Redis6，主从复制,哨兵模式,集群，springCache初高级应用。

目录 1 Docker安装Redis 2 Redis的基础 2 1 redis的key命令 2 2 reids的数据结构 6 0新增的数据结构 1 String 字符串类型 2 List 列表类型 3 set 集合类型 4 Hash
机器学习：集成学习

一集成学习算法简介 1 什么是集成学习集成学习通过建立几个模型来解决单一预测问题它的工作原理是生成多个分类器模型各自独立地学习和作出预测这些预测最后结合成组合预测因此优于任何一个单分类的做出预测 2 复习机器学习的两个核心任
实用的集成学习模型调优策略SWA

集成学习介绍强力的集成学习算法主要有2种基于Bagging的算法和基于Boosting的算法基于Bagging的代表算法有随机森林而基于Boosting的代表算法则有Adaboost GBDT XGBOOST 集成学习的思想同样适用
机器学习-集成学习-梯度提升决策树（GBDT）

目录 1 GBDT算法的过程 1 1 Boosting思想 1 2 GBDT原理需要多少颗树 2 梯度提升和梯度下降的区别和联系是什么 3 GBDT的优点和局限性有哪些 3 1 优点 3 2 局限性 4 RF 随机森林与GBDT之间的区
5.1-集成学习

文章目录集成框架 Framework of Ensemble 一 Ensemble Bagging 1 1 决策树 Decision Tree 1 2 随机森林 Random Forest 二 Ensemble Boosting 2 1
机器学习之集成学习（实验记录）

集成学习实验任务一实验目标二实验内容三实验任务及步骤四实验总结一实验目标了解集成学习的基本结构训练方法实现方法并通过随机森林与Adaboost算法加深理解二实验内容概念集成学习 Ensemble lear

随机推荐

嵌入式系统中，FLASH中的程序代码必须搬到RAM中运行吗？

这个问题 xff0c 核心还是得看你用什么芯片方案 xff01 嵌入式系统涉及技术栈特别庞大 xff0c 不仅仅大家理解的ARM 43 Linux而已我从业11年 xff0c 也只敢说对其中一个方向熟悉而已嵌入式系统中 xff0c 核心
stm32入门开发板选野火还是正点原子呢？

两个可以说都是行业标杆不能说哪个比哪个更好 xff0c 各有特色 xff0c 适合自己就是最好的 xff0c 同行之间都是相互参考去做的我从以下几个维度来对比下 xff1a 1 教程 2 代码 3 开发板价格 4 进阶一教程两家教
树莓派为什么涨价了？

任何东西涨价都是一个原因 xff1a 供不应求别说树莓派 xff0c 很多芯片都涨价了 xff0c 比如说STM32 xff0c 去年最高峰涨了将近10倍所以 xff0c 引发了很多有趣的事比如说 xff1a 以前接到订单老板开心得睡
jtag和swd区别，该用哪个？

我刚开始学习单片机是STC最经典的STC89C52RC 导致我后面很多51的产品应用都会选择STC xff0c 一方面是因为熟悉 xff0c 一方面是使用确实很方便其中最让我满意的就是烧录 xff0c 可以直接用串口就可以下载程序 xff
匈牙利算法原理与Python实现

匈牙利算法原理与Python实现今天学习一个新的算法匈牙利算法 xff0c 用于聚类结果分析 xff0c 先用图表示我当前遇到的问题 xff1a 这两列值是我用不同算法得到的聚类结果 xff0c 从肉眼可以看出第一列聚类为0的结果在第二
STM32之后哪块板子发展最好？

从事开发10年了 xff0c 我来说说我个人见解首先 xff0c 除非是顶尖的垄断技术 xff0c 否则一般不会有屹立不倒的芯片站在研发经理的角度 xff0c 单片机选型时主要会考虑以下几个因素 xff1a 1 稳定性 2 价格 3 交
stm32用什么软件编程烧写比较好呢？

今天给大家分享我从业单片机开发11年必备的神器在刚入行不久 xff0c 看到那些老工程师费很大的劲去搭建开发调试环境 xff0c 让我很不解我想有那工夫 xff0c 我程序都写完了 xff0c 如果有问题就看代码找Bug呗直到后面做了
嵌入式开发要学多久？要学哪些课程

曾经有新手和我抱怨 xff1a 为什么嵌入式开发这么难 xff1f 相信我 xff0c 你不是学不会 xff0c 只是没找对方法这是一片真正为终结迷茫而生的回答 xff0c 内容有点长 xff0c 如果你赶时间 xff0c 建议先点赞
单片机volatile关键字的作用？

最近我们无际单片机学员在做stm8和stm32项目的时候 xff0c 问volatile这个关键词怎么理解 xff1f 有什么作用 xff1f Volatile是C语言的一个关键字 xff0c 在stm8和stm32的固件库里也会经常看见这
STC89C51单片机相比于其他单片机具有那些优点?

STC89C51只适合和同性能的51内核单片机相比 xff0c 性能不同并无可比性 11年前 xff0c 我就是通过自学STC89C51入行单片机开发的到目前为止都非常经典 xff0c 很多开发板都是基于这个芯片去做的我对STC单片机也
单片机怎么实现真正的多线程？

所谓多线程都是模拟的 xff0c 本质都是单线程 xff0c 因为cpu同一时刻只能执行一段代码模拟的多线程就是任务之间快速切换 xff0c 看起来像同时执行的样子据说最近有多核的单片机 xff0c 不过成本应该会高很多对于模拟的多线
单片机能运行操作系统吗？

先直接上答案 xff1a 可以 xff01 但是操作系统不是刚需 xff0c 上操作系统比较占用单片机的资源 xff0c 比如占用比较多的FLASH和RAM xff0c 间接增加了硬件成本 xff0c 哪怕成本增加1毛钱 xff0c 对于上
stm32 单片机主要优点有哪些？

STM32我用了近10年了 xff0c 用它做过的项目至少也有10几个可以说是我用过单片机里 xff0c 最省心最好用的 xff0c 不会有乱七八糟的问题我感觉STM32这几年这么热门 xff0c 开发板至少占了一半功劳不过 xff0
初学stm32单片机可以做什么简单的小作品？

已从事单片机开发十几年 xff0c 刚开始接触单片机时 xff0c 感觉挺有意思可以用自己的思维写程序 xff0c 控制硬件去实现一些智能化的操作刚点亮第一个LED xff0c 就开始幻想以后能做任何自己想要的产品 xff0c 那感觉多
微机原理，有啥书籍推荐？

我从事了单片机开发十几年 xff0c 很惭愧 xff0c 没有完整看完一本技术书籍刚入行那会 xff0c 看过模电 xff0c 给我的感觉就是 xff0c 这书不是给新手看的 xff0c 是给专家看的 xff0c 果断放弃后面又看了一些
public/private/protected的具体区别

1 public xff1a public表明该数据成员成员函数是对所有用户开放的 xff0c 所有用户都可以直接进行调用 2 private xff1a private表示私有 xff0c 私有的意思就是除了class自己之外 xff0
单片机中有FLASH为啥还需要EEROM？

这是一片真正为终结懵逼而生的回答看完如果还不懂 xff0c 那就多看几遍以前我做项目 xff0c 有时用Flash xff0c 有时用EEPROM xff0c 搞得我有点懵逼然后在网上搜了一些资料 xff0c 看完以后还是不能理解
嵌入式软件去哪个公司好？

从事嵌入式单片机开发十几年 xff0c 碰到坑逼公司无数这篇文章不会直接给你说什么公司好 xff0c 而是根据我的惨痛经历 xff0c 聊聊什么公司值得去很多人说去越大的公司越好 xff0c 在大公司里 xff0c 你如同蝼蚁 xff0
该不该放弃嵌入式，单片机这条路？

本文几乎浓缩了我从业10几年的精华 xff0c 内容涵盖我转行打工创业的经历建议从头到尾不要错过一字一句 xff0c 因为字里行间的经验之谈 xff0c 或许能成为你人生重要转折点全文 3700 多字 xff0c 写了 6 个多小
集成学习（Ensemble Learning）

集成学习Ensemble Learning Ensemble LearningDefinitionCommon types of ensemblesBootstrap aggregating Bagging BoostingStacking