Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

2024-04-28

当我使用 xgboost 训练我的数据时2-cates classification problem，我想使用提前停止来获得最佳模型，但我对在预测中使用哪一个模型感到困惑，因为提前停止将返回 3 个不同的选择。例如，我应该使用

preds = model.predict(xgtest, ntree_limit=bst.best_iteration)

或者我应该使用

preds = model.predict(xgtest, ntree_limit=bst.best_ntree_limit)

或者两者都对，并且它们应该应用于不同的情况？如果可以的话，我该如何判断使用哪一个呢？

这是xgboost文档的原始引用，但它没有给出原因，而且我也没有找到这些参数之间的比较：

提前停止

如果您有验证集，则可以使用提前停止来查找最佳的提升轮数。提前停止至少需要 evals 中的一组。如果有多个，它将使用最后一个。

火车（...，评估=评估，early_stopping_rounds=10）

该模型将进行训练，直到验证分数停止提高。验证错误至少需要每一次减少 Early_stopping_rounds 继续训练。

如果发生提前停止，模型将具有三个附加字段： bst.best_score、bst.best_iteration 和 bst.best_ntree_limit。注意 train() 将返回最后一次迭代的模型，而不是最好的模型。普罗法令

经过训练或加载的模型可以执行预测数据集。
# 7 entities, each contains 10 features 
data = np.random.rand(7, 10) 
dtest = xgb.DMatrix(data) 
ypred = bst.predict(dtest)
如果提早停止在训练期间启用，您可以获得最佳预测使用 bst.best_ntree_limit 进行迭代：

ypred = bst.predict(dtest,ntree_limit=bst.best_ntree_limit)

提前致谢。

在我看来，这两个参数指的是同一个想法，或者至少有相同的目标。但我宁愿使用：

preds = model.predict(xgtest, ntree_limit=bst.best_iteration)

从源码中我们可以看到here https://github.com/dmlc/xgboost/blob/663136aa08c00598d8b49adf5901e4cb2ce187da/python-package/xgboost/core.py#L1142 that best_ntree_limit将被放弃以支持best_iteration.

def _get_booster_layer_trees(model: "Booster") -> Tuple[int, int]:
    """Get number of trees added to booster per-iteration.  This function will be removed
    once `best_ntree_limit` is dropped in favor of `best_iteration`.  Returns
    `num_parallel_tree` and `num_groups`.
    """

此外，best_ntree_limit已被删除提前停车 https://xgboost.readthedocs.io/en/latest/python/python_intro.html#early-stopping文档页面。

所以我认为这个属性的存在只是为了向后兼容的原因。因此，从这段代码片段和文档中，我们可以假设best_ntree_limit已被或将被弃用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？的相关文章

keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
参数太少错误，同时未使用参数占位符

我尝试使用 PYODBC 在 Access 数据库中执行 SQL 查询但出现以下错误 pyodbc Error 07002 07002 Microsoft ODBC Microsoft Access 驱动程序参数太少预期为 1 301
在我的 Mac 上以 root 身份运行 pip 时出现“权限被拒绝”

我开始使用我的 Mac 来安装 Python 包就像我在工作中使用 Windows PC 一样然而在我的 Mac 上我经常遇到没有权限写入日志文件或站点包时出错于是我想到了跑步pip install
Python 排列（包括子字符串）

我遇到过这个帖子如何在Python中生成列表的所有排列 https stackoverflow com questions 104420 how to generate all permutations of a list in pyth
如何在 Django 1.4 中自定义管理过滤器

我是 Python 和 Django 开发的新手我从社区提供的易于阅读的示例中学到了很多东西但最近我想为 Django 附带的管理控制台实现一个自定义的管理过滤器我进行了很多搜索只发现了一些过时的方法来完成它例如 Django 1
带有redirect_uri的social-auth-app-django Facebook后端状态

我知道我的问题听起来像是重复的但我到处寻找但没有找到任何解决方案我正在努力为我的 django web 应用程序实现社交登录到目前为止谷歌推特和雅虎登录均按预期工作但facebook总是给出以下错误 URL 被阻止此重定向失败
Django - 该进程无法访问该文件，因为该文件正在被另一个进程使用

我正在尝试在 Windows 10 上运行 Django 我是 Django 的新手我正在使用 Compressor Toolkit 我的问题是我可以运行 manage py 但本地主机说 base html 第 9 行出错该进程无法访
创建 df 以生成给定格式的 json

我正在尝试生成一个 df 来生成下面的 json Json数据 name flare children name K1 children name Exact size 4 name synonyms size 14 name K2 chi
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
Google App Engine self.redirect() POST 方法

在 GAE Python 中使用 webApp 框架调用 self redirect some url 通过 GET 方法将用户重定向到该 URL 是否也可以通过带有一些参数的 POST 方法进行重定向如果可以的话怎样做 Than
django 南迁移，不设置默认值

我使用 South 来迁移我的 Django 模型然而南方有一个令人讨厌的错误它不会在 Postgres 数据库中设置默认值例子 created at models DateTimeField default datetime no
Python：如何对数组 X 进行排序，但对 Y 进行相同的相对排序？

例如 X 5 6 2 3 1 Y 7 2 3 4 6 我对X进行排序 X 1 2 3 5 6 但我希望对 Y 应用相同的相对排序以便数字保持与以前相同的相对位置 Y 6 3 4 7 2 我希望这是有道理的通常你会做一个zip sort
出于安全目的，您是否有理由不执行自己的算法来打乱 ID？

我计划实现我自己的非常简单的哈希公式为具有多个用户的应用程序添加一层安全性我目前的计划如下用户创建一个帐户此时后端会生成一个 ID ID 通过公式运行假设 ID 57 8926 36 7 或同样随机的东西然后我将新的用户
将索引数组转换为 NumPy 中的 one-hot 编码数组

给定一个一维索引数组 a array 1 0 3 我想将其一次性编码为二维数组 b array 0 1 0 0 1 0 0 0 0 0 0 1 创建归零数组b有足够的列即a max 1 然后对于每一行i 设置a i 第列至1 gt
访问 Scrapy 内的 django 模型

是否可以在 Scrapy 管道内访问我的 django 模型以便我可以将抓取的数据直接保存到我的模型中我见过this https scrapy readthedocs org en latest topics djangoitem ht
为什么我可以使用 tsql 连接到 Azure MS SQL，但不能使用 pymssql？

我今天在哪里 TDSVER 7 3 tsql H example database windows net U me D ExampleDB p 1433 P notreallymypassword 这不会 gt gt gt import
通过过滤对 Pyspark Dataframe 进行分组

我有一个数据框如下 cust id req req met 1 r1 1 1 r2 0 1 r2 1 2 r1 1 3 r1 1 3 r2 1 4 r1 0 5 r1 1 5 r2 0 5 r1 1 我必须观察客户看看他们有多少要求看看
Pandas：如何删除以 nan 作为列名的多个列？

根据标题这是一个可重现的示例 raw data x this that this that this np nan np nan np nan np nan np nan np nan y np nan np nan np nan np

随机推荐

获取特定包中的数据集列表

我想获取控制台中显示的特定 R 包中所有数据集的列表我知道这个函数data 将列出加载的包中的所有数据集那不是我的目标我想获取特定 R 包中所有数据集的列表以下尝试不起作用 data data arules Warning mess
在“无头模式”下运行虚拟操作系统意味着什么？

我已经听到很多关于新版本的 VMWare Fusion 如何以无头模式运行虚拟操作系统的信息谷歌搜索清楚地表明其他虚拟化产品也具有类似的功能但是我无法找到这实际上意味着什么的很好的描述当你这样做时会发生什么无头模式意味着虚拟机
PHP：删除任何扩展名的文件？

当用户上传照片时它会检查他们是否已经拥有一张照片如果他们这样做我希望它删除旧的可以有任何扩展名然后放入新的有没有办法在不从数据库获取旧扩展的情况下做到这一点目前的代码 del members gt prepare insert
无法访问我的控制器/构造函数的输入

我有一个简单的 Angular 2 组件 Input 我将其绑定到模板模板显示输入数据但我无法从构造函数访问它 import Component View bootstrap Input from angular2 angular2 i
如何配置 IIS 以在 HTML5 模式下 URL 重写 AngularJS 应用程序？

我有AngularJS 种子项目 https github com angular angular seed我已经添加了 locationProvider html5Mode true hashPrefix 到 app js 文件我想配置
MSBuild 项目部署到本地文件夹并转换配置

我在尝试找到正确的方法来使用 MSBuild 构建 Web 项目并输出仅包含可部署文件即没有 cs csproj Debug config 等但发布到本地文件夹的项目时遇到问题然后我可以通过 FTP RoboCopy 或其他方式传输到
Haskell 错误：“非详尽模式”

所以我有这个功能当我尝试像这样使用它时合并排序列表 1 1 1 1 它给了我一个错误 1 1 例外 SortFunctions hs 86 1 91 89 非详尽函数 mergeSortedLists 中的模式 85 mergeSor
如何向正在运行的 Linux 进程发送 Ctrl-Break？

我正在调试在 Sun 的 JDK 1 4 2 18 上运行的应用程序中的内存泄漏该版本似乎支持命令行参数 XX HeapDumpOnCtrlBreak 这可能会导致 JVM 在遇到控制中断时转储堆如何将其发送到 Linux 机器上的后台
EnumChildWindows 还是 FindWindowEx？

我可以选择使用 API EnumChildWindows 或 FindWindowEx 中的任何一个有什么建议哪个 api 更注重性能 FindWindowEx 内部是否使用 EnumChildWindows 来获取特定窗口的句柄这实际
联合元素对齐

如果我有一个联合 C 标准保证联合本身将与最大元素的大小对齐 union U long l int i short s char c 2 u 但对于工会内部各个工会成员的协调它是怎么说的呢下面的表达式能保证为真吗 u l u i u i
C++ STL 下一个排列与组合

我知道我可以使用std next permutation在包含元素的某些容器上 1 2 3 这将生成该序列的 6 种排列我想做的是给定一些设置 1 2 3 4 5 6 生成大小为 3 的所有可能的排列因此对于这个例子 4 3 2 将是由
如何在主活动中注册接收者？ [复制]

这个问题在这里已经有答案了我有一个SmsReceiver我想在主活动中注册的类我到底应该做什么我是安卓新手你可以做两件事创建和定义BroadcastReceiver in the Manifest 创建并注册BroadcastRe
获取 $_SERVER['AUTH_USER'] 的空白值

我有一个在 Windows 2008 Server R2 上运行的 PHP 应用程序它使用 PHP 的 LDAP 库根据 Active Directory 对用户进行身份验证 As per 这个答案 https stackoverflow
OCaml：如何运行包含库的脚本

我正在按照 Real World OCaml 一书来学习 OCaml 许多程序都需要使用 Jane Street Core 库当我在顶层使用这个核心库中的函数时它工作得很好在那里我只需使用以下命令来打开 Core 库 use top
YouTube iframe 不响应 postMessage 命令

我正在尝试使用来自父级的 postMessage 命令来控制 YouTube iframe 但它似乎不起作用由于多种原因我没有使用 YouTube API 只是使用带有 YouTube 嵌入视频的普通 iframe 我尝试发送命令的方式
monodevelop 2.1+ 支持 Visual Studio 2010 项目文件吗？

monodevelop 2 1 是否支持 Visual Studio 2010 项目文件但是如果不支持有人知道计划何时提供支持吗我问的原因是我有一个在 VS2008 和 Monodevelop 中都使用的解决方案当我在 2010
为什么 reposync 没有签出我在清单文件中指定的分支？

假设我有以下清单文件repo https source android com setup develop repo tool MCVE https stackoverflow com help minimal reproducible e
如何通过父进程杀死子进程？

我使用创建一个子进程fork 如果子进程无法在30秒内完成执行父进程如何杀死子进程我想让子进程最多执行 30 秒如果超过30秒父进程就会杀死它你有想法这样做吗向其发送 SIGTERM 或 SIGKILL http en wiki
Dropzone.js 和每个文件的完整路径

我正在尝试使用 Dropzone js 重新创建删除的文件文件夹的文件夹结构有没有办法访问每个文件的完整路径以便可以在 php 端重新创建目录结构这是一种简单的方法您可以额外发送某些文件夹中所有文件的完整路径 dropzone o
Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

当我使用 xgboost 训练我的数据时2 cates classification problem 我想使用提前停止来获得最佳模型但我对在预测中使用哪一个模型感到困惑因为提前停止将返回 3 个不同的选择例如我应该使用 preds

Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？ 的相关文章

随机推荐

热门标签

Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？的相关文章