ValueError:cross_val_predict仅适用于分区

2024-04-17

我有一个包含特征数组 (X) 和因变量数组 (y) 的多类分类问题。 y 有四个类:1、2、3 和 4。数据严重不平衡,第 4 类只有少数观察结果。我选择的分类器模型为:

model = RandomForestClassifier(n_estimators=10, class_weight='balanced', random_state=0)

我将自定义记分器定义为:

custom_scorer = {'accuracy': make_scorer(accuracy_score),
                 'balanced_accuracy': make_scorer(balanced_accuracy_score),
                 'precision': make_scorer(precision_score, average='weighted'),
                 'recall': make_scorer(recall_score, average='weighted'),
                 'roc auc': make_scorer(roc_auc_score, multi_class='ovo', needs_proba=True),
                 'f1': make_scorer(f1_score, average='weighted')
                 }

由于数据不平衡,我使用cross_validate:

cv = RepeatedStratifiedKFold(n_splits=10, n_repeats=3, random_state=1)
scores = cross_validate(model, X, y, cv=cv, scoring=custom_scorer, n_jobs=-1)

来自scores我得到了指标准确度、平衡准确度、精度、召回率等。但是,这只给我指标,而不是包含预测类的数组。我想要得到y_pred(y 的预测值)也可能是在执行以下代码行时在内部生成的:

scores = cross_validate(model, X, y, cv=cv, scoring=custom_scorer, n_jobs=-1)

但是,为了获得 y 的预测,我使用:

y_pred = cross_val_predict(model, X, y, cv=cv) 

这给了我一个错误:

ValueError:cross_val_predict仅适用于分区

如果我将上面的代码更改为

y_pred = cross_val_predict(model, X, y, cv=10)

那么我可以避免该错误,但是 cv=cv 和 cv=10 不是同一件事,是吗?如果我使用以下方法计算对应于每个类别的精度、召回率等:

precision, recall, fscore, support = score(y, y_pred)

那些不能对应于scores我计算使用交叉验证.

我还需要为 y 计算的概率值。

y_proba = cross_val_predict(model, X, y, cv=cv, method='predict_proba')

这也给了我一个错误

ValueError:cross_val_predict仅适用于分区

请帮忙。


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ValueError:cross_val_predict仅适用于分区 的相关文章

  • scipy 将一个稀疏矩阵的所有行附加到另一个稀疏矩阵

    我有一个 numpy 矩阵 想在其中附加另一个矩阵 这两个矩阵的形状为 m1 shape 2777 5902 m2 shape 695 5902 我想将 m2 附加到 m1 以便新矩阵的形状为 m new shape 3472 5902 当
  • 使用 matplotlib 从“列表列表”绘制 3D 曲面

    我已经搜索了一些 虽然我可以找到许多有用的网格网格示例 但没有一个清楚地表明我如何将列表列表中的数据转换为可接受的形式 以适应我所讨论的各种方式 当谈到 numpy matplotlib 以及我所看到的建议的术语和步骤顺序时 我有点迷失 我
  • 递归 lambda 表达式可能吗?

    我正在尝试编写一个调用自身的 lambda 表达式 但我似乎找不到任何语法 或者即使它是可能的 本质上我想将以下函数传输到以下 lambda 表达式中 我意识到这是一个愚蠢的应用程序 它只是添加 但我正在探索可以在 python 中使用 l
  • opencv水印周围的轮廓

    我想在图像中的水印周围画一个框 我已经提取了水印并找到了轮廓 但是 不会在水印周围绘制轮廓 轮廓是在我的整个图像上绘制的 请帮我提供正确的代码 轮廓坐标的输出为 array 0 0 0 634 450 634 450 0 dtype int
  • 补丁 - 为什么相对补丁目标名称不起作用?

    我已经从模块导入了一个类 但是当我尝试修补类名而不使用模块作为前缀时 出现类型错误 TypeError Need a valid target to patch You supplied MyClass 例如 以下代码给出了上述错误 imp
  • 如何检查python xlrd库中的excel文件是否有效

    有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件 我知道还有其他库可以检查文件头 我可以使用文件扩展名检查 但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
  • Kivy - 有所有颜色名称的列表吗?

    在 Kivy 中 小部件 color属性允许输入其值作为字符串颜色名称 也 例如在 kv file Label color red 是否有所有可能的颜色名称的列表 就在这里 来自Kivy 的文档 https kivy org doc sta
  • Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确?

    在 OS X 和 Python 中处理 Unicode 文件名有点困难 我试图在代码中稍后使用文件名作为正则表达式的输入 但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同 采取以下代码 usr b
  • 工作日重新订购 Pandas 系列

    使用 Pandas 我提取了一个 CSV 文件 然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来 但当然它按照与该系列相同的排名顺序绘制
  • Python3.0 - 标记化和取消标记化

    我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
  • Pandas:如果单元格包含特定文本则删除行

    pandas 中的这段代码不起作用 如果该列包含提供的任何文本 数字 我希望它删除该行 目前 我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作 因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
  • Keras:如何保存模型或权重?

    如果这个问题看起来很简单 我很抱歉 但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
  • 在 matplotlib 中的极坐标图上移动径向刻度标签

    From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
  • Django send_mail SMTPSenderRefused 530 与 gmail

    一段时间以来 我一直在尝试使用 Django 从我正在开发的网站接收电子邮件 现在 我还没有部署它 并且我正在使用Django开发服务器 我不知道这是否会影响它 这是我的 settings py 配置 EMAIL BACKEND djang
  • 通过索引访问Python字典的元素

    考虑一个像这样的字典 mydict Apple American 16 Mexican 10 Chinese 5 Grapes Arabian 25 Indian 20 例如 我如何访问该字典的特定元素 例如 我想在对 Apple 的第一个
  • Jython 和 SAX 解析器:允许的实体不超过 64000 个?

    我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
  • Mac OSX 10.6 上的 Python mysqldb 不工作

    我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行 我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
  • 动态过滤 pandas 数据框

    我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
  • Elasticsearch 通过搜索返回拼音标记

    我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换 从弹性搜索中进行一些字符串匹配 我的问题是
  • Django Admin 中的反向内联

    我有以下 2 个型号 现在我需要将模型 A 内联到模型 B 的页面上 模型 py class A models Model name models CharField max length 50 class B models Model n

随机推荐

  • RGB空间中不同颜色的识别范围是多少?

    如何以编程方式确定给定像素是否为黄色 还是红色 或者其他颜色 红色在RGB空间中通常是 255 0 0 但我们也知道 230 0 0 也会出现红色 是否有任何标准将 RGB 空间分成八种主要颜色 红 绿 蓝 黄 洋红 青色 黑色和白色 在
  • 在 Linux 上使用“libc++”编译时,未定义对“__cxa_thread_atexit@@CXXABI”的引用

    我正在尝试编译我的项目Arch Linux x64 using libc libc abi and 铿锵 3 6 0 项目编译正确 但无法链接并出现以下错误 错误 CMakeFiles main cpp o 对符号 cxa thread a
  • 如何制作“透视”文字?

    I have body with a background image and a div with background color作为白色 我正在尝试制作有关该内容的文字div 这就是所谓的 content 看透 让文字就像是网站背景的
  • 从传递给分部视图的嵌套复杂对象中获取值

    我有一个 ViewModel 它的成员之一是一个复杂的对象 复杂对象有 4 个属性 都是字符串 我正在尝试创建一个可重用的部分视图 我可以在其中传递复杂的对象并让它使用 html 帮助器为其属性生成 html 这一切都很好 但是 当我提交表
  • Postgresql:对 2 列联合的唯一约束

    我有以下表格 交易 id amount 1 100 2 100 3 250 4 250 TRANSACTION LINKS id send tx receive tx 1 2 1 2 4 2 The send tx and receive
  • 将 MUI 工具提示放置在容器内,使其不会溢出到容器之外

    在此输入图像描述 https i stack imgur com gKP8k jpg 例如 在此图像中 当我将鼠标悬停在左侧的按钮 单击 上时 工具提示将离开红色边框容器 右侧按钮也会发生同样的情况 我想动态更改工具提示位置 以便在这两种情
  • Spring中的@RequestParam如何处理Guava的Optional?

    RequestMapping value contact html method RequestMethod POST public final ModelAndView contact RequestParam value name re
  • Python 中的 SSL 模块不可用(在 OSX 上)

    我跑步时遇到问题pip install在 OSX 10 13 上的 virtualenv 中 我已经跑了brew install openssl和路径 usr local include openssl指着 opt openssl incl
  • 确定 C/C++ 结构与其成员的对齐方式

    如果已知结构成员的对齐方式 是否可以找到结构类型的对齐方式 Eg for struct S a t a b t b c t c S max alignment of a alignment of b alignment of c 的对齐方式
  • 出现错误:指定的文件扩展名“.webtest”不是有效的测试扩展名

    尝试跑步MSTEST exe我通过安装的Agents For Visual Studio 2017下载 https www visualstudio com downloads https www visualstudio com down
  • 如何使用 PHP 在浏览器上按“刷新”按钮时删除 $_POST 变量?

    当我按下浏览器上的 刷新 按钮时 似乎 POST变量在刷新过程中被保留 如果我想删除其中的内容 POST我应该怎么办 使用unset对于以下领域 POST没有帮助 帮助 谢谢 请求标头包含一些 POST 数据 无论您做什么 当您重新加载页面
  • 如何使用 FTP 在目录之间移动文件?

    我有一个程序需要将文件从 FTP 服务器上的一个目录移动到另一个目录 例如 该文件位于 ftp 1 1 1 1 MAIN Dir1 我需要将文件移动到 ftp 1 1 1 1 MAIN Dir2 我发现了几篇推荐使用 重命名 命令的文章 因
  • 无效的速记属性初始值设定项[关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我在 JavaScript 中为节点项目编写了以下代码 但在测试模块时遇到了错误 我不确定这个错误是什么意思 这是我的代码 var
  • 为什么使用继承类型的泛型类未检测到类约束?

    表达这个问题很难 我希望下面的代码片段能让事情变得清楚 public class DemoClass
  • 如何保留换行符

    换行符和回车符 一定是编码中最复杂的部分 为我 将此代码放在页面中 来自数据库 存储为This from Ricardo nAnd also a test nRent 3000 00 td title This from Ricard An
  • Mathematica 中的分类树实现

    我想使用以下方法实现简单的分类树 二元分类 数学 我怎样才能实现二叉树数学 有这样做的符号吗 我想说这取决于你想用数据结构做什么 您可以利用 Mathematica 表达式本身就是树的事实 如果只有叶节点相关 则使用嵌套列表 例如 1 2
  • echo 命令,然后运行它? (如制作)

    有没有某种方法可以让 bash 进入一种详细模式 这样 当它运行 shell 脚本时 它会在运行之前回显将要运行的命令 也就是说 这样就可以看到运行的命令 以及它们的输出 类似于make 也就是说 如果运行像这样的 shell 脚本 ech
  • Sublime Text 2 和 MinGW

    再会 任何人都可以分享他们如何将 MinGW 编译器附加到 Sublime 的经验吗 我在互联网上找到了一个配置 但是当我运行编译的程序时 会弹出错误 其中缺少 MinGW bin 中的文件 Config cmd mingw32 g exe
  • 扩展小部件之间的空白

    一些 Flex 值会在 Expanded 小部件之间创建空白 据我所知 这是计算的其余部分 例如 Scaffold body Column children
  • ValueError:cross_val_predict仅适用于分区

    我有一个包含特征数组 X 和因变量数组 y 的多类分类问题 y 有四个类 1 2 3 和 4 数据严重不平衡 第 4 类只有少数观察结果 我选择的分类器模型为 model RandomForestClassifier n estimator