Python：如何从 Optuna LightGBM 研究中检索最佳模型？

2024-01-08

我希望获得稍后在笔记本中使用的最佳模型，以使用不同的测试批次进行预测。

可重现的示例（取自 Optuna Github）：

import lightgbm as lgb
import numpy as np
import sklearn.datasets
import sklearn.metrics
from sklearn.model_selection import train_test_split

import optuna


# FYI: Objective functions can take additional arguments
# (https://optuna.readthedocs.io/en/stable/faq.html#objective-func-additional-args).
def objective(trial):
    data, target = sklearn.datasets.load_breast_cancer(return_X_y=True)
    train_x, valid_x, train_y, valid_y = train_test_split(data, target, test_size=0.25)
    dtrain = lgb.Dataset(train_x, label=train_y)
    dvalid = lgb.Dataset(valid_x, label=valid_y)

    param = {
        "objective": "binary",
        "metric": "auc",
        "verbosity": -1,
        "boosting_type": "gbdt",
        "lambda_l1": trial.suggest_loguniform("lambda_l1", 1e-8, 10.0),
        "lambda_l2": trial.suggest_loguniform("lambda_l2", 1e-8, 10.0),
        "num_leaves": trial.suggest_int("num_leaves", 2, 256),
        "feature_fraction": trial.suggest_uniform("feature_fraction", 0.4, 1.0),
        "bagging_fraction": trial.suggest_uniform("bagging_fraction", 0.4, 1.0),
        "bagging_freq": trial.suggest_int("bagging_freq", 1, 7),
        "min_child_samples": trial.suggest_int("min_child_samples", 5, 100),
    }

    # Add a callback for pruning.
    pruning_callback = optuna.integration.LightGBMPruningCallback(trial, "auc")
    gbm = lgb.train(
        param, dtrain, valid_sets=[dvalid], verbose_eval=False, callbacks=[pruning_callback]
    )

    preds = gbm.predict(valid_x)
    pred_labels = np.rint(preds)
    accuracy = sklearn.metrics.accuracy_score(valid_y, pred_labels)
    return accuracy

我的理解是，下面的研究将调整准确性。我想以某种方式从研究中检索最佳模型（不仅仅是参数）而不将其保存为泡菜，我只想在笔记本中的其他地方使用该模型。


if __name__ == "__main__":
    study = optuna.create_study(
        pruner=optuna.pruners.MedianPruner(n_warmup_steps=10), direction="maximize"
    )
    study.optimize(objective, n_trials=100)

    print("Best trial:")
    trial = study.best_trial

    print("  Params: ")
    for key, value in trial.params.items():
        print("    {}: {}".format(key, value))

期望的输出是

best_model = ~model from above~
new_target_pred = best_model.predict(new_data_test)
metrics.accuracy_score(new_target_test, new__target_pred)

对@Toshihiko Yanase 的回答进行简短补充，因为条件study.best_trial==trial对我来说从来都不是真的。即使两个 (Frozen)Trial 对象具有相同内容时也是如此，因此这可能是 Optuna 中的错误。将条件改为study.best_trial.number==trial.number为我解决了问题。

另外，如果您不想在 Python 中使用全局变量，则可以使用学习和试用用户属性

def objective(trial):
    gmb = ...
    trial.set_user_attr(key="best_booster", value=gbm)

def callback(study, trial):
    if study.best_trial.number == trial.number:
        study.set_user_attr(key="best_booster", value=trial.user_attrs["best_booster"])


if __name__ == "__main__":
    study = optuna.create_study(
        pruner=optuna.pruners.MedianPruner(n_warmup_steps=10), direction="maximize"
    )
    study.optimize(objective, n_trials=100, callbacks=[callback])
    best_model=study.user_attrs["best_booster"]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

lightGBM

optuna

Python：如何从 Optuna LightGBM 研究中检索最佳模型？的相关文章

如何使用python从文件夹中的pdf中提取文本并将其保存在数据框中？

我有很多文件夹每个文件夹都有几个 pdf 文件也有其他文件类型如 xlsx 或 doc 我的目标是提取每个文件夹的pdf文本并创建一个数据框其中每条记录都是文件夹名称每列以字符串形式表示该文件夹中每个pdf文件的文本内容我设法
如何使用 lstm 执行多类多输出分类

I have multiclass multioutput classification see https scikit learn org stable modules multiclass html https scikit lear
BeautifulSoup 不适用于某些网站

我有这个脚本 import urrlib2 from bs4 import BeautifulSoup url http www shoptop ru page urllib2 urlopen url read soup Beautiful
numpy.linalg.inv() 是否给出了正确的矩阵逆？编辑：为什么 inv() 给出数值错误？

我有一个矩阵形状 4000 4000 我想取逆矩阵我对逆矩阵的直觉因如此大的矩阵而崩溃起始矩阵的值大小为e 10 具有以下值 print matrix给出一个输出 2 19885119e 10 2 16462810e 10 2 1306
pandas：使用运算符链接过滤 DataFrame 的行

大多数业务在pandas可以通过操作符链接来完成 groupby aggregate apply等但我发现过滤行的唯一方法是通过普通的括号索引 df filtered df df column value 这没有吸引力因为它需要我分配d
如何消除 matplotlib 轴的相对偏移

当我尝试对具有足够大数字的范围进行绘图时我得到一个所有刻度都有相对偏移的轴例如 plot 1000 1001 1002 1 2 3 我在横坐标轴上得到这些刻度 0 0 0 5 1 0 1 5 2 0 1e3 问题是如何删除 1e3并得到
如何在 PySide/PyQt 中制作一个位于屏幕中央的小部件？

这段代码有效但我想知道是否有更简单的方法 def center self qr self frameGeometry cp gui QDesktopWidget availableGeometry center qr moveCenter
python 中使用 scipy 截断正态分布

我正在尝试使用截断正态分布scipy在Python3 我想做一些简单的事情绘制以 0 5 为中心范围从 0 到 1 的截断法线的 pdf 我有以下代码行 from scipy import truncnorm import matplo
Python 对象初始化错误。或者我误解了对象的工作原理？ [复制]

这个问题在这里已经有答案了 1 import sys 2 3 class dummy object 4 def init self val 5 self val val 6 7 class myobj object 8 def init s
神经网络误差随每个训练示例而振荡

我已经实现了一个反向传播神经网络并根据我的数据对其进行了训练数据在英语和非洲语句子之间交替神经网络应该识别输入的语言网络结构为27 16 2 输入层对于字母表中的每个字母都有 26 个输入加上一个偏置单元我的问题是当遇到每个新的训
继承类中的python __init__方法[重复]

这个问题在这里已经有答案了我想为子类提供一些额外的属性而不必显式调用新方法那么有没有办法给继承的类一个 init 不重写的类型方法 init 父类的方法我编写下面的代码纯粹是为了说明我的问题因此属性等的命名很糟糕 class in
在 matplotlib 中分割图例

是否有可能将一个大图例分成多个通常是 2 个较小的图例 from pylab import t arange 0 0 2 0 0 01 s sin 2 pi t plot t s linewidth 1 0 label Graph1 g
VS Code Pylance 不突出显示变量和模块

我正在使用带有 Python 和 Pylance 扩展的 VS Code 我遇到的问题是 Pylance 扩展没有对模块和数据框等内容进行语法突出显示我希望顶部的模块为绿色 df 变量为蓝色我正在使用默认的深色颜色主题这是我的 VS
在 R 中绘制决策树（插入符）

我已经训练了一个数据集rf方法例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
导入pytorch时，未安装microsoft Visual C++ Redistributable

我在一台带有 GPU 的 Windows 机器上工作我已经在 conda 环境中安装了 pytorch conda install pytorch torchvision cudatoolkit 10 1 c pytorch 然后我运行
Python 中的“finally”总是执行吗？

对于Python中任何可能的try finally块是否保证finally块总是会被执行吗例如假设我在except block try 1 0 except ZeroDivisionError return finally print
python 中的优化标准化

在优化过程中对输入参数进行归一化使它们处于同一数量级通常会很有帮助这样收敛效果会更好例如如果我们想要最小化 f x 而合理的近似值是 x0 1e3 1e 4 则将 x0 0 和 x0 1 归一化到大约相同的数量级可能会有所帮助
如何使用 Python 3 在 OpenCV 3 上正确加载 cv2.KeyPoint 和描述符？

有一天我不得不恢复一个使用 OpenCV 3 和 Python 2 7 的旧项目在此代码中要加载 cv2 KeyPoint 我执行以下操作 import numpy as np import cPickle import cv2 ke
将glade接口放入python中

我在 Glade 中制作了一个 gui 我想将其放入 python 程序中我正在调整我在网上找到的教程中的说明以将其加载到我的林间空地文件中 http www pygtk org articles pygtk glade gui Cre
带有 graphviz_layout 的水平树

在Python中使用networkx 我可以用以下方法绘制垂直树 g nx balanced tree 2 4 pos nx graphviz layout g prog dot nx draw g pos labels b all no

随机推荐

移动 ib_logfile1 和 ib_logfile0 文件后出现问题

我想增加innodb log file size为了更好的性能我将其从默认值增加到 256 MB 像往常一样我收到错误消息InnoDB Error log file ib logfile0 is of different size 0
如何在 Codeigniter 中使用包含模板和基本模板？

我过去曾使用过自定义 php 框架和 django 模板它们都支持我所说的基本模板这意味着您有一个包含页眉和页脚的文件以及一个带有 id 内容的 div 现在视图文件中的所有内容仅包含填充内容 div 的代码部分页眉和页脚由
类型“any[]”中缺少属性“0”，但类型“[{ id: string;”中需要属性“0” gp：布尔值； }]

界面如下所示 export interface Patient doctors id null gp null 这是我的元组 linkedDoctorShort Array
Visual Studio 2010 未捕获生成时的编译错误

我有一个在 Visual Studio 2010 中运行的 Web 项目目标是 Net Framework 4 当我构建解决方案时它会告诉我构建成功即使代码中存在已知错误如果我打开一个有错误的页面编译器将发现该错误并用蓝色
如何从 jquery mobile 中的日期框中删除当前日期？

如何从日期框中删除当前日期实际上当我打开日期框时它会突出显示当前日期但用户选择日期示例 14 如果用户再次打开日期框它会突出显示 14 和当前日期这是我的小提琴http jsfiddle net ravi1989 uhdYv 1
实体框架 4.3.1 无法创建（/打开）数据库 [线程异常？]

我使用过 EF 4 1 代码优先不久前在一个 MVC 3 项目中效果很好今天我尝试使用 EF 4 3 1 代码优先在一个 WinForms 项目中遇到了一些真正的巫毒我正在从事的原始项目是 WinForms 但是对于attach
Python 中的二进制补码？

Python 中的整数以二进制补码形式存储对吗虽然 gt gt gt x 5 gt gt gt bin x 0b101 And gt gt gt x 5 gt gt gt bin x 0b101 那真是太蹩脚了如何让 python 给
Symfony 2 + Twig 全局变量

如何让一个树枝全局变量在使用包含更改后保持修改状态我想要的输出是设置更深尽管我得到原始设置应用程序配置 config yml twig globals testvar original setting root html tw
在 Angular 2 项目中导入 crypto-js（使用 Angular-cli 创建）

我正在尝试在我的 angular2 项目中导入 crypto js 我遵循了几个SO问题也角度 cli 指南 https github com angular angular cli wiki 3rd party libs 但最后我仍然有
如何在 A-Frame 中使用检查点控件？

我是 A 型框架的新手仍在努力弄清楚一切我目前正在构建一个 3D 空间并希望通过在地板上提供点供游客点击并传送到该位置来为游客创建引导体验我发现这段代码 https codepen io shaunix pen bgBbMj edi
更新 dockerfile 后如何重新部署 kubernetes 中的所有内容？

我对 kubernetes 非常陌生此时我想做的就是重新启动我的集群并让它运行更新的 dockerfile 顺便说一句我正在 google cloud platform 中运行 kubernetes kubectl 从版本 1 15 开
Python / Pandas - 删除以字符串开头的列

我有一个像这样的数据框 id 2013 Profits 2001 Revenues 1999 Assets 31 xxxx xxxx xxxx 我想删除不以 201 开头的列我只想保留 2010 年及以后的数据我怎样才能做到这一点 Us
解析 pyspark 中数组的每个元素并应用子字符串

您好我有一个 pyspark 数据框其数组 col 如下所示我想迭代每个元素并仅获取连字符之前的字符串并创建另一列 array col hello 123 abc 111 hello 234 def 22 xyz 33 hiiii 1
我可以隐藏 PHP 警告：未定义的数组键而不抑制所有其他警告吗？ [复制]

这个问题在这里已经有答案了因此看起来他们改变了访问具有未知密钥的数组会引发消息的方式
如何从 Material UI TextField、DropDownMenu 组件获取数据？

我创建了一个表单其中包含几个 TextField DropDownMenu Material UI 组件问题是如何从一个 obj 中的所有 TextField DropDownMenus 收集所有数据并将其发送到服务器对于 TextF
Weka 标准化柱

我有一个包含 14 个数字列的 ARFF 文件我想分别对每列执行标准化即将每列的值修改为 actual value min this column max this column min this column 因此列中的所有值都将在
Jenkins 管道脚本中的 withContext() 隐藏控制台输出

我有这个詹金斯管道脚本您应该能够将其直接粘贴到空白管道构建中 import hudson console LineTransformationOutputStream import hudson console ConsoleLogFil
在 JUNG 中使用鼠标右键单击弹出菜单

我想创建一个弹出菜单如果我右键单击画布就会出现该菜单我怎样才能做到这一点我应该修改哪个函数任何帮助将不胜感激 protected class PopupGraphMousePlugin extends AbstractPopup
如何生成AxInterop文件？

我们有一个依赖于旧的 VB6 OCX 的 NET 项目整个项目最初是 VB6 和 C 我们正在逐渐将其全部迁移到 Net 但我们需要它在当前的半迁移状态下工作我们的一位开发人员可以构建该项目但其他人不能开发人员发现他引用了 inte
Python：如何从 Optuna LightGBM 研究中检索最佳模型？

我希望获得稍后在笔记本中使用的最佳模型以使用不同的测试批次进行预测可重现的示例取自 Optuna Github import lightgbm as lgb import numpy as np import sklearn data

Python：如何从 Optuna LightGBM 研究中检索最佳模型？

Python：如何从 Optuna LightGBM 研究中检索最佳模型？ 的相关文章

随机推荐

热门标签

Python：如何从 Optuna LightGBM 研究中检索最佳模型？的相关文章