机器学习-XGBoost

2023-11-04

一、XGBoost是什么

XGBoost是基于GBDT实现的,但GBDT算法只利用了一阶的导数信息，xgboost对损失函数做了二阶的泰勒展开，并在目标函数之外加入了正则项对整体求最优解，用以权衡目标函数的下降和模型的复杂程度，避免过拟合。

同时XGBoost在许多竞赛上有着非常好的表现

二、XGBboost与scikit-learn结合使用、

XGBoost提供一个wrapper类，允许模型可以和scikit-learn框架中其他分类器和回归器一样对待

XGBoost中的分类器为XGBClassifier

三、sklearn中XGBClassifier参数

一般需要调的参数有max_depth、learning_rate、n_estimators、reg_alpha、reg_lambda、subsample、colsample_bytree、colsample_bylevel

不需要调的参数(通用参数)：booster、slient、nthread

1、booster：弱学习器类型

--可选gbtree(树模型)或gbliner(线性模型)

--默认为gbtree（树模型为非线性模型能更好的处理复杂问题）

2、slient：是否开启静默模式

--1：静默模式开启不输出任何信息

--0：默认值，输出一些中间信息，以助于我们了解模型的状态

3、nthread：线程数

--默认为-1，表示使用系统所有cpu核

对于调参的建议：

--可以设置较小的学习率，然后用交叉验证确定n_estimators

--行（subsample）、列（colsample_bytree、colsample_bylevel）下采样比例，默认值为1，即不进行下采样，建议值：0.3-0.8，加强泛化能力。

--数的最大深度（max_depth）：默认为6，建议3-10

竞赛大佬建议：三个最重要的参数为：树的数目、树的深度、学习率，调整策略：

--采用默认参数试一试

--如果系统过拟合，降低学习率

--如果系统欠拟合，加大学习率

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

算法

机器学习-XGBoost 的相关文章

代码随想录算法训练营Day18 | 二叉搜索树中的插入操作、二叉搜索树的最近公共祖先、删除二叉搜索树的节点、修剪二叉搜索树、二叉搜索树转换成累加树、将有序数组转换成二叉搜索树

LeetCode 701 二叉搜索树的插入操作本题思路既然是二叉搜索树那么插入就变得比较简单了因为二叉搜索树的左树节点值都小于根节点值右树节点值都大于根节点值直接将要插入的节点值和根节点进行对比如果比它小就往左孩子走比他大
基于粒子群算法的电动汽车充电动态优化策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
【质量-弹簧-阻尼系统】基于脉冲响应约束的子空间辨识研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【C++入门】C++ STL中string常用函数用法总结

目录前言 1 string使用 2 string的常见构造 3 string类对象的访问及遍历迭代器遍历访问 4 string类对象的容量操作 4 1 size和length 4 2 clear empty和capacity 4 3
排序：计数排序

一概念计数排序是非比较排序是对哈希直接定址法的变形应用二思想利用数组统计相同数据出现的次数例如整型数据m出现n次就在数组m位置记录数据为n 最后从头遍历数组打印数据即可通俗来讲就是数组下标即为数据下标所指位置的值即为数
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
华为OD机试2024年最新题库（C++）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 C 解法问1 考
【状态估计】【卡尔曼-加权最小二乘(KEWLS)和KEWLS-KF(KKF)】采用低维线性卡尔曼滤波器将单个传感器测量外推/预测到单个估计瞬间，用于WLS多点定位方法的新方法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
华为OD机试真题-分配土地-Python-OD统一考试（C卷）

题目描述从前有个村庄村民们喜欢在各种田地上插上小旗子旗子上标识了各种不同的数字某天集体村民决定将覆盖相同数字的最小矩阵形的土地的分配给为村里做出巨大贡献的村民请问此次分配土地做出贡献的村民中最大会分配多大面积输入描述第一行
矩阵基本操作3

题目描述问题描述定义一个N M N M lt 100 的矩阵将一个该矩阵的行和列的元素互换存到另一个二维数组中输入格式一行两个整数 N M 中间用空格隔开表示矩阵有N行 M列接下来共N行M列表示矩阵输出格式输出转置以后的
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
『力扣刷题本』:逆波兰表达式求值

大家好久不昂最近 1 个多月罗根一直在备考期末文章发的很少现在已经放寒假啦学习自然也不能拉下毕竟 4 月份就要去参加蓝桥杯了先给自己定个小目标日更 2 篇咳咳下面马上开始讲题一题目给你一个字符串数组 tokens 表
用栈实现队列（OJ中报错的处理）

用栈实现队列 ERROR AddressSanitizer myQueueFree函数中栈的释放处现了问题没有调用StackDestory而是直接free了这个是栈初始化时 capacity与malloc申请的空间大小没有匹配请你仅使
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
5_机械臂运动学基础_矩阵

上次说的向量空间是为矩阵服务的 1 学科回顾从科技实践中来的数学问题无非分为两类一类是线性问题一类是非线性问题线性问题是研究最久理论最完善的而非线性问题则可以在一定基础上转化为线性问题求解线性变换数域 F 上线性空间V中的变
最大流-Dinic算法，原理详解，四大优化，详细代码

文章目录零前言一概念回顾可略过 1 1流网络 1 2流 1 3最大流 1 4残留网络 1 5增广路
【算法】使用BFS算法（队列、哈希等）解决最短路径问题（C++）

文章目录 1 前言 1 1 什么是最短路问题 1 1 1 什么是权值 1 2 如何解决此类最短路径 1 3 BFS解最短路径前提 FloodFill 洪流问题 2 算法题

随机推荐

第三次C语言课程设计作业

上节课我们学习了文件型指针的运用这节课我们则学习了变量型指针和链表的学习的使用还了解了free函数 malloc函数的应用指向结构体变量的指针变量的定义形式与一般指针变量的定义形式相同只是将其指向类型定义为结构体类型即可例如 st
Eclipse 常用快捷键

常用的编辑 Ctrl 1 快速修复解决很多问题比如import类 try catch包围等 Ctrl Shift F 格式化当前代码 Ctrl Shift M 添加类的import导入 Ctrl Shift O 组织类的import导
时间序列分析之ARIMA模型预测__R篇

相关文章时间序列分析之ARIMA模型预测 SAS篇之前一直用SAS做ARIMA模型预测今天尝试用了一下R 发现灵活度更高结果输出也更直观现在记录一下如何用R分析ARIMA模型 1 处理数据 1 1 导入forecast包 fore
使用Hutool的流方式读取Excel大文件

官网介绍在标准的ExcelReader中如果数据量较大读取Excel会非常缓慢并有可能造成内存溢出因此针对大数据量的Excel Hutool封装了Sax模式的读取方式 Excel07SaxReader支持Excel2007格式的S
Unity Notes之控制粒子系统的最大粒子数量

Unity中的粒子系统使用起来还是比较方便的不过在实际过程中遇到这样的一个问题需要动态的来控制一个粒子系统组件所能产生的最大粒子数看doc上说是有maxParticles来控制但实际上却没有这个开放的参数只能通过其它的方式来实现
STM32F103RBT6型号说明

STM32系列专为要求高性能低成本低功耗的嵌入式应用设计的ARMCortex M0 M0 M3 M4和M7内核主流产品 STM32F0 STM32F1 STM32F3 超低功耗产品 STM32L0 STM32L1 STM32L4 ST
在Idea中使用控制台，显示文件

在Idea中使用控制台显示文件前言在IDEA创建项目时 IDEA会自动帮你生成一个存放 class文件的地方就是在out目录下而可执行的代码都在src目录下可以在src目录下创建packet 包可以把Java作业放在一个 Pr
Zookeeper学习笔记四之持久节点和临时节点

持久节点和临时节点 znode节点可以是持久 persistent 节点还可以是临时 ephemeral 节点持久节点node 如 path 只能通过delete命令进行删除而临时节点相反当创建临时节点的客户端崩溃或者关闭了与Zoo
CAD导出DXF再导入PADS出现尺寸大小不一致的解决办法？

如下错误 1 用CAD打开板框删除板框多余部分只留需要的部分注意从左边拖动鼠标选中再删除如果从右边拖动鼠标选中无法全选 2 设置原点选中整个板框输入命令m 点击最左下脚输入坐标0 0设置为原点此时板框完全不见了双击滚轮
制作Centos7自动安装镜像(三)

文章总览制作Centos7自动安装镜像在这里说明一下我们制作自动化安装镜像用的是linux的kickstart技术这个技术的核心是制作一个ks cfg文件将所有需要自动化安装的内容写成一个脚本放置在镜像中并在安装菜单中指定这个
文件I/O和标准I/O的区别

文件I O 文件I O是操作系统提供的操作文件的API 例如Linux中的open 和write 等这些函数可以完成文件的操作但是效率不一定很高标准I O 标准I O是应用层提供的库函数例如C语言提供的文件操作函数fopen fcl
Qt信息隐藏(Q_D/Q_Q)介绍

目录 1 基本介绍与二进制兼容 2 二进制兼容的设计原则 3 常见c qt信息隐藏 4 Q Q Q D介绍 5 定制可编辑treewidget与如何访问基类的Private 6 总结 1 基本介绍与二进制兼容作者虽然一直在linux做开发
Vue + Spring Boot 项目实战（分享）

第一部分Vue Spring Boot 项目实战一项目简介Vue Spring Boot 项目实战二搭建 Vue js 项目Vue Spring Boot 项目实战三前后端结合测试登录页面开发 Vue Spring Boot
Google earth engine学习笔记 2: 通过分析提取植被物候的代码学习gee 1

Google earth engine学习笔记 2 通过分析提取植被物候的代码学习gee 1 通过一篇根据 sentinel 2 影像计算植被指数并提取植被物候的文章所附的代码学习gee 原作者的github 写这个东西是为了自己学习
python-scrapy框架（三）Pipeline文件的用法讲解

Pipeline是一个独立的模块用于处理从Spider中提取的Item对象实现对数据的进一步处理存储和清洗等操作下面将详细介绍Scrapy框架中Pipeline的用法 1 创建Pipeline类为了使用Pipeline类我们需要
物联网终端算法

物联网终端算法是指在物联网终端设备上运行的各种算法包括数据采集数据预处理数据传输数据存储数据处理数据分析等算法以下是物联网终端算法的一些具体应用数据采集算法用于采集各种传感器数据包括温度湿度气压光照声音震动等信
华为OD机试 Java 实现【最优策略组合下的总的系统消耗资源数】【牛客练习题】，附详细解题思路

目录一题目描述二输入描述三输出描述四解题思路五 Java算法源码六效果展示 1 输入 2 输出 3 说明 4 思路华为OD机试 2023B卷题库疯狂收录中刷题点这里一题目描述在通信系统中有一个常见的问题是对用
0成本的售卖高考资料虚拟资源，这样的玩法顶得上一家大公司

在这个快速发展每天的信息成千上万的世界中对于网络从业者来说网络的信息就是金钱以至于让活在当下的大多数年轻人中年人甚至在校学生都会想在互联网这个金矿去分一块肉吃但是每个人的时间都是平等的一天24小时出去吃饭睡觉甚至除去上班
同时校验手机号和座机号

文章目录同时校验手机号和座机号一使用实例同时校验手机号和座机号 filter方法是js中常用的方法提示以下是本篇文章正文内容下面案例可供参考一使用实例 1 同时校验手机号和座机号 export function check
机器学习-XGBoost

一 XGBoost是什么 XGBoost是基于GBDT实现的但GBDT算法只利用了一阶的导数信息 xgboost对损失函数做了二阶的泰勒展开并在目标函数之外加入了正则项对整体求最优解用以权衡目标函数的下降和模型的复杂程度避免过拟合

热门标签