为什么 LightGBM 中的 R2 分数为零？

2024-04-15

import numpy as np
import pandas as pd
import lightgbm
from sklearn.metrics import r2_score,mean_squared_error as MSE
dataset = pd.read_excel("Prali Marble.xlsx")
X = dataset.iloc[:,2].values.reshape((-1, 1))
Y = dataset.iloc[:,3].values

from lightgbm import LGBMRegressor
lgb_r = LGBMRegressor()
lgb_r.fit(X,Y)
y_pred = lgb_r.predict(X)
print("LGBM R2_SCORE:", r2_score(Y, lgb_r.predict(X)))

给出R2分数ZERO，那么为什么 LGBMRegressor 会得到零值呢？我没有分割我的数据 train_test 因为我的数据集很小。

这个例子不能完全重现，因为内容"Prali Marble.xlsx"不包括在内。

However, I can reproduce a 0.0 R² with the following code that I think closely matches your example. Similar to your code, this trains a LightGBM regression model on a dataset with a single feature.

这段代码使用lightgbmPython 3.8 上的 3.1.1。

import numpy as np
import pandas as pd
import lightgbm as lgb
from sklearn.metrics import r2_score,mean_squared_error as MSE

X = pd.DataFrame({
    "feat1": np.append(np.repeat(0.5, 99), np.ones(1))
})
Y = np.random.random(100, )

lgb_r = lgb.LGBMRegressor()
lgb_r.fit(X,Y)

y_pred = lgb_r.predict(X)
print("LGBM R2_SCORE:", r2_score(Y, lgb_r.predict(X)))

LGBM R2_SCORE：0.0

In this case, the R² is 0 because the model is just predicting the mean of Y. You can see this by examining the structure of the model.

lgb_r.booster_.trees_to_dataframe()

这将返回 1 行数据帧，当 LightGBM 不添加任何树时会发生这种情况。

LightGBM 有一些参数用于防止过度拟合。这里有两个相关的：

min_data_in_leaf https://lightgbm.readthedocs.io/en/latest/Parameters.html#min_data_in_leaf（默认=20）
min_sum_hessian_in_leaf https://lightgbm.readthedocs.io/en/latest/Parameters.html#min_sum_hessian_in_leaf（默认=0.001）

您可以通过将这些参数设置为 0 来告诉 LightGBM 忽略这些过拟合保护。

import numpy as np
import pandas as pd
import lightgbm as lgb
from sklearn.metrics import r2_score

X = pd.DataFrame({
    "feat1": np.append(np.repeat(0.5, 99), np.ones(1))
})
Y = np.random.random(100, )

lgb_r = lgb.LGBMRegressor(
    min_data_in_leaf=0,
    min_sum_hessian_in_leaf=0.0
)
lgb_r.fit(X,Y)

y_pred = lgb_r.predict(X)
print("LGBM R2_SCORE:", r2_score(Y, lgb_r.predict(X)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

lightGBM

为什么 LightGBM 中的 R2 分数为零？的相关文章

Google App Engine queue.yaml 无法在开发服务器中工作

我无法让 dev appserver py 识别我使用queue yaml 创建的自定义队列他们没有出现在http localhost 8000 taskqueue http localhost 8000 taskqueue 当我尝试向其
python 中的并行处理

在 python 2 7 中进行并行处理的简单代码是什么我在网上找到的所有示例都很复杂并且包含不必要的代码我该如何做一个简单的强力整数分解程序在每个核心 4 上分解 1 个整数我真正的程序可能只需要2个核心并且需要共享信息我知
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
如何检查python xlrd库中的excel文件是否有效

有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件我知道还有其他库可以检查文件头我可以使用文件扩展名检查但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
如何在 Python 中加密并在 Java 中解密？

我正在尝试在 Python 程序中加密一些数据并将其保存然后在 Java 程序中解密该数据在Python中我像这样加密它 from Crypto Cipher import AES KEY 1234567890123456789012
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
一段时间后终止线程的最 Pythonic 方法

我想在线程中运行一个进程它正在迭代一个大型数据库表当线程运行时我只想让程序等待如果该线程花费的时间超过 30 秒我想终止该线程并执行其他操作通过终止线程我的意思是我希望它停止活动并优雅地释放资源我认为最好的方法是通过Thre
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
Django 的 request.FILES 出现 UnicodeDecodeError

我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
Jython 和 SAX 解析器：允许的实体不超过 64000 个？

我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练

随机推荐

使用 moviepy 对 matplotlib 图形进行动画处理很困难

我必须制作大量 90 000 人物的动画作为上下文它绘制了 1700 年至 1950 年间每一天的地图并在相关日期标记了感兴趣的事件我可以使用以下方法来做到这一点matplotlib animation FuncAnimation
处理 Django REST Framework 中不同级别的嵌套

例如如果您采用模型 class Region models Model id models AutoField primary key True name models CharField max length 256 class Com
使用 Ninject 2.2 更改默认对象范围

是否可以更改 Ninject 2 2 中的默认对象范围如果是这样是如何完成的据我所知你可以覆盖AddBinding on the BindingRoot StandardKernel or NinjectModule 并修改Scope
帖子中的 req.body 为空

突然之间我的所有项目都发生了这种情况每当我使用express和body parser在nodejs中发帖时req body是一个空对象 var express require express var bodyParser require
在spark中读取谷歌存储桶数据

我已经按照这个博客读取了谷歌存储桶中存储的数据 https cloud google com dataproc docs connectors install storage connector https cloud google com
ASP MVC 5 日期格式验证问题

在我的 ASP MVC 5 Web 应用程序中我需要以特定格式显示日期页面加载时文本格式正确但是如果您编辑该值或只是尝试发布则会显示验证错误该字段定义如下 Creation div class form group Html
在 ASP.Net 中通过 foreach 循环制作下拉列表

我们可以使用以下语法在 asp net 组件中创建下拉列表
在 Windows 中打开演示模式？

Windows Vista 具有演示模式您可以通过移动中心将其打开我如何以编程方式打开它我发现的唯一方法是打电话presentationsettings exe with start or stop直接地我还发现这个链接描述了如何
如何使用 Composition API 在 Vue.js 3 中使类 getter 响应式？

我正在尝试使类实例属性响应以在身份验证失败时显示错误消息用户模型 ts export class User private error string set errorMessage errorMessage string this er
从项目列表中仅选择（显示：块）元素 Jquery

我正在制作一个菜单需要从 Jquery 返回的元素列表中选择一个特定元素当我在控制台上运行时 type subMenu 这将返回 4 个匹配的子菜单元素 div type subMenu style display block div
在 SkiaSharp 中不使用 PaintSurface 事件进行绘图的最有效方法

这个的延伸question https forums xamarin com discussion 99300 is there a way to access a sksurface outside of the paintsurface
如何阻止 SVN Checkout 恢复从项目中删除的文件？

我们是 subversion tortoisesvn ankhsvn 堆栈的新手虽然在 Studio 2008 中我们从项目中删除了文件但问题是当我们在 CI 构建中执行 svn checkout 时我们会得到已删除的文件如何防止这
如何在 swing 中将选定的对象从一个 JList 传输到另一个 JList？

我想将选定的对象从一个 JList 传输到另一个 JList 例如 List1 和 List2 在这里我向您展示从以下位置转移城市名称的示例list to list 1 您将收到如下输出代码是 import java awt EventQ
YQL API请求私有数据认证错误

我正在使用 YQL 为我的 yahoo Fantasy Football League 提取一些数据我已经创建了该应用程序它给了我一个消费者密钥但我如何将此信息传递给 yahoo api 来让我登录我知道我必须使用 OAuth 但
在 openCV 和 python 中计算二值图像中的曲线、角度和直线

我想编写一个工具来查找图像中每个有界对象内的角度曲线和直线的数量所有输入图像均为白底黑字并且全部代表字符如图所示对于每个有界区域记录每个形状的出现最好能够有一个阈值规定曲线必须弯曲到什么程度才能被视为曲线而不是角度等对于直
Meteor：如何在 collectionHandle.ready() 为 true 后触发辅助函数的重新运行

这是我的旧版本的新版本question http pastebin com xG0zLE0X 感谢 Tom Coleman 的帮助我终于弄清楚了如何正确检查订阅是否就绪我当前的代码结构如下所示 client app js eventsH
如何在android中的textview中使用“Open Sans”字体样式？

如何使用Open Sansandroid中textview的字体样式默认情况下在字体系列中Open Sans不可用 Android O 和 Android 支持库 26 添加了对可下载字体的支持 Google Fonts 正在 Googl
如何将自动 CSS 连字符与“word-break：break-all”一起使用？

我在用着word break break all 并想知道如何让浏览器自动插入hyphens https developer mozilla org en US docs CSS hyphens 如在MDN 示例 https develop
APScheduler执行后立即退出

我正在尝试为 Github 上的一个项目做出贡献以收集资金数据代码 time keeper py from apscheduler scheduler import Scheduler class TimeKeeper def ini
为什么 LightGBM 中的 R2 分数为零？

import numpy as np import pandas as pd import lightgbm from sklearn metrics import r2 score mean squared error as MSE da

为什么 LightGBM 中的 R2 分数为零？

为什么 LightGBM 中的 R2 分数为零？ 的相关文章

随机推荐

热门标签

为什么 LightGBM 中的 R2 分数为零？的相关文章