机器学习实战（集成学习与随机森林）

2023-11-16

集成学习与随机森林

更新权重

Adaboost

AdaBoostClassifier(base_estimator=None, n_estimators=50,
learning_rate=1.0, algorithm=’SAMME.R’,
random_state=None)
- base_estimator:可选参数，默认为DecisionTreeClassifier。
- algorithm：可选参数，默认为SAMME.R
循环训练，实例权重不断更新（不是是成本函数最小化，而是加入更多预测器）

Gradient Boosting

新预测器针对前一个预测器的残差进行拟合
GradientBoostingRegressor(max_depth=2,n_estimators=3,learning_rate=1.0,random_state=42)
- 提前停止法
  - 训练完之后测量每个阶段的训练验证误差，找到树的最优数量后重新训练
  - errors = [mean_squared_error(y_val, y_pred) for y_pred in gbrt.staged_predict(X_val)]
  - bst_n_estimators = np.argmin(errors) + 1
  - 验证误差在连续某次未改善时停止训练

xgboost

xgbc = XGBClassifier(max_depth=2, 
                     learning_rate=1, 
                     n_estimators=2, # number of iterations or number of trees
                     slient=0,
                     objective="binary:logistic"
                    )

不更新权重

投票分类器

基于多分类器的结果聚合
- voting_clf = VotingClassifier(estimators=[
  (‘log_clf’, LogisticRegression()),
  (‘svm_clf’, SVC(probability=True)),
  (‘dt_clf’, DecisionTreeClassifier(random_state=10)),
  ], voting=‘soft’)

voting_clf.fit(X_train, y_train)
voting_clf.score(X_test, y_test)

bagging./pasting

有放回抽样。在每个数据集上学习出一个模型，最后的预测结果利用N个模型的输出得到，具体地：分类问题采用N个模型预测投票的方式，回归问题采用N个模型预测平均的方式。
- 1.通过设置参数 bootstrap=False来切换为无放回采样。
  2.n_estimators=500，表示有有500个相同的决策器。
  3.max_samples=100，表示在数据集上有放回采样 100 个训练实例。
  4.n_jobs=-1，n_jobs 参数告诉 sklearn 用于训练和预测所需要 CPU 核的数量。（-1 代表着 sklearn 会使用所有空闲核）
  5.oob_score=True，表示包外评估bag_clf.oob_score_
随机森林
- rnd_clf = RandomForestClassifier(n_estimators=500, max_leaf_nodes=16, random_state=42)
- 重要参数
  - n_estimators，random_state，boostrap和oob_score
- 重要属性
  - .estimators_ .oob_score_ .feature_importances_
- 接口
  - apply，fit，predict，score和predict_proba

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

学习笔记

机器学习

python

随机森林

机器学习实战（集成学习与随机森林）的相关文章

在PyGI中获取窗口句柄

在我的程序中我使用 PyGObject PyGI 和 GStreamer 在 GUI 中显示视频该视频显示在Gtk DrawingArea因此我需要获取它的窗口句柄realize 信号处理程序在 Linux 上我使用以下方法获取该句
Tkinter：消息小部件中锚点选项的正确值是多少？

我一直在学习 tkinterTkinter 中的消息小部件 https python course eu tkinter message widget in tkinter php at Python 课程和教程 https python
Flask中使用的路由装饰器是如何工作的

我熟悉 Python 装饰器的基础知识但是我不明白这个用于 Flask 路由的特定装饰器是如何工作的以下是 Flask 网站上的代码片段 from flask import Flask escape request app Flask
为什么我的混淆矩阵只返回一个数字？

我正在做二元分类每当我的预测等于事实时我发现sklearn metrics confusion matrix返回单个值难道没有问题吗 from sklearn metrics import confusion matrix print
Tkinter 菜单删除项

如何删除任何菜单项例如我想删除播放 self menubar Menu self root self root config menu self menubar self filemenu2 Menu self menubar self
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
numpy：高效执行数组的复杂重塑

我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid M N load data data numpy fromfile file dirname fid dtype numpy dtype i4 convert
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
Python 2 的 `exceptions` 模块在 Python3 中丢失了，它的内容到哪里去了？

一位朋友提到对于 Python 2 假设您在命令行上的路径环境变量中有它 pydoc exceptions 非常有用知道它应该可以为他每周节省几分钟的网络查找时间我自己每周都会用谷歌搜索一次例外层次结构所以这对我来说也是一个有用的提
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
PyInstaller“ValueError：源代码字符串不能包含空字节”

我得到了一个ValueError source code string cannot contain null bytes执行命令时pyinstaller main py在具有和不具有管理员权限的cmd中 Traceback most re
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
高效创建抗锯齿圆形蒙版

我正在尝试创建抗锯齿加权而不是布尔圆形掩模以制作用于卷积的圆形内核 radius 3 no of pixels to be 1 on either side of the center pixel shall be decimal a
如何在 scikit 中加载 CSV 数据并将其用于朴素贝叶斯分类

尝试加载自定义数据以在 Scikit 中执行 NB 分类需要帮助将示例数据加载到 Scikit 中然后执行 NB 如何加载目标的分类值使用相同的数据进行训练和测试或使用完整的数据集进行测试 Sl No Member ID Membe

随机推荐

ffmpeg常用编解码命令

ffmpeg常用编解码命令 1 ffplay exe 1 播放MP4文件指定标题以及播放分辨率 ffplay exe window title 视频监控 x 720 y 576 i 2019 09 19 14 21 20 Ch7 mp4
数组17--机器人的运动范围

数组17 机器人的运动范围 jz66 题目概述解析参考答案注意事项说明题目概述算法说明地上有一个m行和n列的方格一个机器人从坐标0 0的格子开始移动每一次只能向左右上下四个方向移动一格但是不能进入行坐标和列坐标的数
Qt重绘之update,repaint详解

Qt里面的重绘和Windows编程里面的重绘差不多但是Qt的重绘更有特色更加智能在讲之前先说说paintEvent paintEvent 是一个虚函数槽 slot 子类可以对父类的paintEvent进行重写当调用update r
【C51自学笔记】数码管（静态与动态显示）+74HC138+点阵的动态显示

数码管数码管由7个发光二极管组成一个日字形如果需要显示小数点那么就再加一个点就是8段数码管数码管显示亮度高响应速度快分共阴和共阳两种形式常用的有单个的和联的还有两联的和专门用来显示时间的分类共阴共阳编码问题必须
sqli-labs(34)

0x01构造闭合同样发现被注释掉了试探了一波发现什么信息都不会返回正确错误的页面都一样之前我们的方法就是将过滤函数添加的给吃掉而get型的方式我们是以url形式提交的因此数据会通过URLencode 如何将方法用在post
本地以图搜图识图工具——嗅图狗！(python3.6实现图像比对指路，代码git)

1 写在前面因为之前做完后当毕业设计做的为了尽量实用打了个exe 结果好多人反应问题索性直接把代码更新exe的链接都写个博客放在这里这么晚才放出源码就是怕毕设查重全部项目源码git及说明 https github com na
获取outputstream大小_apache POI - 获取生成的excel文件的大小

I m using Apache POI for generating excel file in my spring mvc application here is my spring action RequestMapping valu
【微信小程序】scroll-view滚动

1 竖向滚动 wxml文件
在解决程序问题中遇到的比较有用的模块

retry 用来判断程序是否异常 pbar tqdm a b c d for char in pbar time sleep 3 pbar set description Processing s char 安装 pip install r
内网安全之：Kerberos 域用户提权漏洞(MS14-068；CVE-2014-6324)

郑重声明本笔记编写目的只用于安全知识提升并与更多人共享安全知识切勿使用笔记中的技术进行违法活动利用笔记中的技术造成的后果与作者本人无关倡导维护网络安全人人有责共同维护网络文明和谐 Kerberos 域用户提权漏洞 MS14 06
rate-based 拥塞控制吞吐测量

要点一个方法无法精确刻画链路画像就用多种方法组合刻画设计一个自定义平均当前 Linux kernel TCP 实现的 TCP delivery rate 测量机制 BBR 有使用到如下图简略后可展示为下图详见 net ipv
入行十年，卷王也卷不动了，想对新人说...

很多年前当我还是一名学生的时候有一次高我好几届已工作几年的师兄回校给我们做交流听说他已经是高级自动化测试工程师在深圳某企业月入上万那时候心里一阵崇拜觉得高级开发该是多么厉害的存在让我无数次憧憬着成为像他一样厉害且收入高的
css flex布局 —— 容器属性 flex

flex flow属性是flex direction属性和flex wrap属性的简写形式默认值为row nowrap box flex flow
Udacity Deep Learning课程作业（五）

作业五是根据Text8的语料库训练一个语言模型word2vec 得到语料库中每个词的嵌入式表达向量 Mikolov提出的word2vec包括skip gram和CBOW两种模型前者是根据给定词预测其周围的词后者是根据周围的词预测中间的
Invocation of init method failed； nested exception is java.lang.IllegalArgumentException: Property ‘

记一次踩坑 SpringBoot2 2 5 mybatis plus 启动出现异常 org springframework beans factory BeanCreationException Error creating bean wi
android接入支付宝自动续费,APP是如何实现自动续费的？

01目标在APP内实现会员自动续费的功能 02流程 2 1 会员自动续费授权会员自动续费本质是委托扣款模式只有用户完成签约商户才可以对用户账户进行自动扣款从而完成会员订单的支付操作用户在应用内通过微信或支付宝的SDK完成代扣签约
使用Qt编写模块化插件式应用程序

动态链接库技术使软件工程师们兽血沸腾它使得应用系统程序可以以二进制模块的形式灵活地组建起来比起源码级别的模块化二进制级别的模块划分使得各模块更加独立各模块可以分别编译和链接模块的升级不会引起其它模块和主程序的重新编译这点对于
19秋学期计算机网络基础在线作业,南开19秋学期(1709、1803、1809、1903、1909)《计算机网络基础》在线作业资料答案3...

19秋学期 1709 1803 1809 1903 1909 计算机网络基础在线作业 0003 试卷总分 100 得分 100 一单选题共 15 道试题共 30 分 1 物理层的主要任务描述为确定与传输媒体的接口的一些特性指明对于
Oracle 实现类似 drop table if exists 表存在删除的效果

Oracle没有drop table if exists 使用存储过程实现定义存储过程 create or replace procedure proc droptable p table in varchar2 is v count n
机器学习实战（集成学习与随机森林）

集成学习与随机森林更新权重 Adaboost AdaBoostClassifier base estimator None n estimators 50 learning rate 1 0 algorithm SAMME R rando

机器学习实战（集成学习与随机森林）

集成学习与随机森林

更新权重

Adaboost

Gradient Boosting

xgboost

不更新权重

投票分类器

bagging./pasting

机器学习实战（集成学习与随机森林） 的相关文章

随机推荐

热门标签

机器学习实战（集成学习与随机森林）的相关文章