Scikit learn 错误消息“精度和 F 分数定义不明确，在标签中设置为 0.0”[重复]

2024-03-07

我正在研究二元分类模型，分类器是朴素贝叶斯。我有一个几乎平衡的数据集，但是当我预测时，我收到以下错误消息：

UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples.
  'precision', 'predicted', average, warn_for)

我正在使用 gridsearch 和 CV k-fold 10。测试集和预测包含这两个类，所以我不理解该消息。我正在研究 6 个其他模型的相同数据集、训练/测试分割、CV 和随机种子，这些模型工作得非常完美。数据从外部提取到数据帧中，进行随机化并且种子是固定的。然后，朴素贝叶斯分类模型在此代码片段之前的开头对文件进行分类。

X_train, X_test, y_train, y_test, len_train, len_test = \
     train_test_split(data['X'], data['y'], data['len'], test_size=0.4)
pipeline = Pipeline([
    ('classifier', MultinomialNB()) 
])

cv=StratifiedKFold(len_train, n_folds=10)

len_train = len_train.reshape(-1,1)
len_test = len_test.reshape(-1,1)

params = [
  {'classifier__alpha': [0, 0.0001, 0.001, 0.01]}

]

grid = GridSearchCV(
    pipeline,
    param_grid=params,
    refit=True,  
    n_jobs=-1, 
    scoring='accuracy',
    cv=cv, 
)

nb_fit = grid.fit(len_train, y_train)

preds = nb_fit.predict(len_test)

print(confusion_matrix(y_test, preds, labels=['1','0']))
print(classification_report(y_test, preds))

我被Python“强迫”改变了系列的形状，也许这就是罪魁祸首？

警告的含义

正如这里的其他答案所暗示的那样，您会遇到精度F-Score由于其定义而无法计算（精度/召回率等于 0）。在这种情况下，指标的分数值为 0。

测试数据包含所有标签，为什么还会出现这种情况？

嗯，你正在使用K-Fold（特别是在你的情况下k=10），这意味着一个特定的分割可能包含一类的 0 个样本

即使使用分层 K 折，这种情况仍然会发生

这有点棘手。分层 K-Fold 确保每次分组中每个类别的部分相同。然而，这不仅仅取决于真实的班级。例如，精确计算如下：TP/predicted yes。如果由于某种原因，您正在预测所有样本No，你将会拥有predicted yes=0，这将导致未定义的精度（这可能导致未定义的F-Score).

这听起来像是一个边缘情况，但考虑到这样一个事实：在网格搜索中，您可能正在搜索大量不同的组合，其中一些组合可能完全关闭，并导致这种情况。

我希望这回答了你的问题！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Scikit learn 错误消息“精度和 F 分数定义不明确，在标签中设置为 0.0”[重复] 的相关文章

Python 3 中的递归搜索 JSON/DICT

我在 Python 3 中实现了一些 API 这些 API 允许我根据班级代码接收有关学校的信息但我想知道如何通过类代码获取信息例子我输入代码GF528S我希望程序告诉我班级 3C INF 地址 Address 1 Milan 如果可
Python BS4 Scraper 仅返回每个页面的前 9 个结果

我让这段代码按预期工作只是它并没有完全按预期工作一切似乎都很顺利直到我检查了我的 csv 输出文件并注意到我每页只得到前 9 个结果每页应该有 40 个结果因此我得到的结果少于预期的 25 有什么想法吗 import reques
为什么 python 允许没有“pass”语句的空函数（带有文档字符串）主体？

class SomeThing object Represents something def method one self This is the first method will do something useful one da
用于在 Windows 中自动执行桌面活动的 Python 代码

我想使用 Python 在 Windows 环境中自动化桌面活动怎样才能做到呢一些例子也会有帮助我所说的桌面活动是指控制鼠标和键盘访问活动窗口属性双击桌面上的图标最小化和最大化窗口通过键盘向输入弹出窗口输入数据等操作看一下S
“初始化 MCI 时出现问题”播放声音问题

我正在尝试使用 Playsound 播放代码文件夹中的文件但是每次运行代码时它似乎都能够调用该文件但我总是收到以下输出 playsound PlaysoundException Error 277 for command open p
有没有办法清理 jinja2 生成的 html？

我们使用 jinja2 来创建 html 但是由于我们在 jinja 中执行许多循环和其他操作来生成 html 所以 html 看起来很丑注意这只是为了美观我们可以做些什么来清理 html 吗除了清理我们的 jinja2 代码之
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
AES 会话密钥的 RSA 解密失败，并显示“AttributeError：‘bytes’对象没有属性‘n’”

我正在努力在 Python 3 6 上从 PyCryptodome 实现公钥加密当我尝试创建对称加密密钥并加密解密变量时一切正常但是当我引入 RSA 和 PKCS1 OAEP 的那一刻一切就都顺理成章了 session key加密
PyQt：如何设置组合框项目可检查？

为了将 GUI 小部件数量保持在最低限度我需要找到一种方法来为用户提供下拉菜单项的选择这些菜单项可用于过滤掉 listWidget 项中显示的内容假设 listWidget 列出了 5 个不同类别的项目 Cat A Cat B Cat
Scrapy 未通过请求回调从项目中的已抓取链接返回附加信息

基本上下面的代码会抓取表格的前 5 项其中一个字段是另一个 href 单击该 href 会提供更多信息我想收集这些信息并将其添加到原始项目中所以parse应该将半填充的项目传递给parse next page然后刮掉下一位并返回完成
如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items
Scrapy 仅抓取每个页面的第一个结果

我目前正在尝试运行以下代码但它只保留每个页面的第一个结果知道可能是什么问题吗 from scrapy contrib spiders import CrawlSpider Rule from scrapy contrib linkext
使用 Python 读取 App Engine 上的文件？

是否可以在 GAE 上打开文件来读取其内容并获取最后修改的标签我收到 IOError Errno 13 文件无法访问我知道我无法删除或更新但我相信阅读应该是可能的有人遇到过类似的问题吗 os stat f r st mtim 您可能
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
在 Python 中进行模糊键查找的最佳方法？

我遇到一个问题我需要在哈希映射中进行模糊查找即返回与最接近查询的键相对应的值在我的例子中是通过 Levenshtein 距离测量的我目前的方法是子类化dict使用特殊的查找方法计算所有键的编辑距离然后返回得分最低的键的值基本上是
Tornado：DummyFuture 不支持结果阻塞

我试图获得一个非常简单的初始服务器它可以异步获取 url 来工作但它会抛出 Exception DummyFuture does not support blocking for results 有这个SO https stacko
为什么类型提示“float”接受“int”，而它甚至不是子类？

一方面我了解到数字可以int or float应将类型注释为float 来源 PEP 484 类型提示 https www python org dev peps pep 0484 the numeric tower and 这个计算器问
为什么你可以在字符串上重载 __radd__ 而不是 __rmod__ ？

在Python中您可以覆盖右和左加法运算符
Django：单击按钮加载另一个模板

我已经在 django 项目上工作了几个星期只是玩玩以便掌握它的窍门我有点困惑我现在有一个名为 home html 的模板我想知道是否可以将另一个名为 profile html 的模板设置为 home html 模板上的链接我有一

随机推荐

请确保您的 Service Worker 文件包含以下内容：/(const precacheManifest =)\[\](;)/

我对 React Workbox 还很陌生我试图让我的 Electron React 应用程序能够缓存所有图像和数据以便在离线时可用这正是我在 YouTube 视频中想要实现的目标 14 00 到 21 00 分钟使用 React
Ruby on Rails：无法在生产中注销应用程序

我在 Heroku 上部署了一个应用程序除了注销之外一切正常当我单击链接退出时出现以下错误您要查找的页面不存在您可能输入了错误的地址或者页面可能已移动如果您是应用程序所有者请检查日志以获取更多信息对于用户身份验证我当然
可以容纳 64 位大小整数的完美数字幂（使用优先级队列）

我们怎样才能打印出所有可以表示为 64 位长整数的完美幂 4 8 9 16 25 27 完美幂是一个可以写为 ab 的数字对于整数 a并且b 2 这不是作业问题我在算法设计书的求职面试问题部分找到了它提示本章是基于优先级队列的我的
使用 onbeforeunload 事件，“离开页面”时 url 发生变化

我有一个要求当用户付款并到达成功页面并返回时应该将其重定向到自定义页面因此如果我单击浏览器后退按钮它将显示两个选项离开页面和留在此页面当我单击离开页面时它应该重定向到我的自定义页面我发现以下链接很有用但不适用于离开页面
将枚举值绑定到标签 XAML

我正在使用枚举字段来跟踪程序的状态 public enum StatiMacchina InAvvio 1 Pronta 2 InLavorazione 3 InMovimento 4 InAttesa 5 InErrore 6 我想绑定跟
中心引导行和跨度

我正在尝试使用引导程序将行及其内部的跨度居中您可以在页脚中看到它 http www divisionforty com wall http www divisionforty com wall 我希望社交网络图标位于左侧版权位于中间由
MVC 6 OpenIdConnect

目前我在将 MVC 应用程序从 beta 3 迁移到 4 时遇到了多个问题其中之一与 OpenIdConnect 到 Windows Azure 进行身份验证有关当我转到具有授权属性的页面时该页面会停止处理并位于空白页面而不会显示
我无法以编程方式检测 angularjs 中的值变化

我是 angularjs 的新手我遇到了麻烦 I have html像这样 section class content div div section
DTO 道 POCO BO

事实上我对这些术语以及它们之间的关系感到非常困惑我读过有关其中每个人的一些内容但我不了解工作流程 DTO 数据传输对象传输值的对象BO 业务对象域模型中的对象用于制作业务逻辑的对象POCO 不知道我在维基上读过定义但什么也没
Vue-i18n - 无法读取未定义的属性“配置”

首先我向您展示什么是有效的在 App js 中 import router from routes js import VueI18n from vue i18n const messages en message hello hell
PHP静态成员不保值

大家好我正在编写的 WordPress 插件遇到了一个奇怪的问题但这与 WordPress 本身无关更多地与 PHP 有关所以请继续阅读以便我可以解释 WordPress 插件已连接以便调用 init 函数这有效我可以确认它
iOS 模拟器中屏幕内容仅显示在部分屏幕上

我的 iOS 模拟器仅将内容显示为屏幕的一部分我该如何修复它我正在使用 XCode 6 3 1 谢谢你只需要重新启动它有时会发生这种情况强制关闭模拟器并重新启动
Django 中的syncdb 时内容类型过时

当我努力的时候syncdb对于我的 django 项目我看到以下抱怨 The following content types are stale and need to be deleted myapp Any objects relat
在Java中调用Python？

我想知道是否可以使用 Jython 从 Java 代码调用 Python 函数还是只能从 Python 调用 Java 代码 Jython 用于 Java 平台的 Python http www jython org index html
Docker 注册表镜像未使用

当我尝试从本地镜像中提取图像时它起作用了 docker login u docker p mypassword nexus3 pleiade mycomp fr 5000 docker pull nexus3 pleiade mycomp
数字签名服务器上的私钥存储在哪里？

我正在开发一个客户端服务器应用程序需要在发送到客户端之前使用私钥对某些文件进行签名然后客户端将使用公钥验证签名因此私钥需要始终位于服务器上并且可由服务器应用程序读取问题是我想知道在哪里存储我的私钥这样在服务器受到威胁时更安全
为什么 sizeWithFont:constrainedToSize:lineBreakMode: 返回错误的大小？

我想要在表格单元格的标签中显示的字符串有两种可能的宽度并且我需要计算高度以便正确记录表格单元格的高度然而无论我对约束尺寸做什么我都会得到相同的高度这在我想要的情况下是不正确的我正在使用的代码 CGFloat width 300
如何使用prepareForReuse方法

我发现这个方法叫做 void prepareForReuse I 阅读文档 https developer apple com documentation uikit uitableviewcell但我不明白如何使用它当我滚动表格视图时
如何使用 C# 创建包装 RTD 函数的 Excel 自动化插件？

我有一个基于 RtdServer 的可用自动化插件如何使用 RtdServer 在 C 中创建实时 Excel 自动化插件 https stackoverflow com questions 5397607 howto create a
Scikit learn 错误消息“精度和 F 分数定义不明确，在标签中设置为 0.0”[重复]

这个问题在这里已经有答案了我正在研究二元分类模型分类器是朴素贝叶斯我有一个几乎平衡的数据集但是当我预测时我收到以下错误消息 UndefinedMetricWarning Precision and F score are ill

Scikit learn 错误消息“精度和 F 分数定义不明确，在标签中设置为 0.0”[重复]

Scikit learn 错误消息“精度和 F 分数定义不明确，在标签中设置为 0.0”[重复] 的相关文章

随机推荐

热门标签