Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组

2024-03-26

我有这个带有目标的数据集LULUS，这是一个不平衡数据集。我正在尝试打印roc auc如果我可以对数据的每个折叠进行评分，但在每个折叠中，不知怎的，它总是会引发错误说ValueError: y should be a 1d array, got an array of shape (15, 2) instead.。我有点困惑我做错了哪一部分，因为我的做法与文档中的完全一样。经过几次折叠，我发现如果只有一个标签，它不会打印分数，但它会返回有关一维数组的第二种类型的错误。

merged_df = pd.read_csv(r'C:\...\merged.csv')

num_columns = merged_df.select_dtypes(include=['float64']).columns
cat_columns = merged_df.select_dtypes(include=['object']).drop(['TARGET','NAMA'], axis=1).columns

numeric_transformer = Pipeline(steps=[
    ('imputer', SimpleImputer(strategy='mean')),
    ('scaler', StandardScaler())])

categorical_transformer = Pipeline(steps=[
    ('imputer', SimpleImputer(strategy='most_frequent')),
    ('label', OneHotEncoder(handle_unknown='ignore'))])

preprocessor = ColumnTransformer(
    transformers=[
        ('num', numeric_transformer, num_columns),
        ('cat', categorical_transformer, cat_columns)])

X = merged_df.drop(['TARGET','Unnamed: 0'],1)
y = merged_df['TARGET']

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)

X_train = X_train.drop(['NIM', 'NAMA'],1)
X_test = X_test.drop(['NIM', 'NAMA'],1)

rf = Pipeline(steps=[('preprocessor', preprocessor),
                     ('classifier',tree.DecisionTreeClassifier(class_weight='balanced', criterion='entropy'))])

rf.fit(X_train, y_train)

pred = rf.predict(X_test)

y_proba = rf.predict_proba(X_test)

from sklearn.model_selection import KFold

kf = KFold(n_splits=10)

for train, test in kf.split(X):
    X_train, X_test = X.loc[train], X.loc[test]
    y_train, y_test = y.loc[train], y.loc[test]
    model = rf.fit(X_train, y_train)
    y_proba = model.predict_proba(X_test)
    try:
        print(roc_auc_score(y_test, y_proba,average='weighted', multi_class='ovr'))
    except ValueError:
        pass

See my 电子表格中的数据 https://docs.google.com/spreadsheets/d/1lXluQ6CmjBj4YriLKGBPdMl4Vuh4xx6UgdQqNsWKwXw/edit?usp=sharing

您的输出来自model.predict_proba()是一个有 2 列的矩阵，每个类别一列。要计算 roc，您需要提供正类的概率：

使用示例数据集：

from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import roc_auc_score
from sklearn.model_selection import train_test_split

X, y = make_classification(n_classes=2)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.33, random_state=42)
rf = RandomForestClassifier()
model = rf.fit(X_train, y_train)
y_proba = model.predict_proba(X_test)

它看起来像这样：

array([[0.69, 0.31],
       [0.13, 0.87],
       [0.94, 0.06],
       [0.94, 0.06],
       [0.07, 0.93]])

Then do:

roc_auc_score(y_test, y_proba[:,1])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组的相关文章

在 pandas 中单独打印一列的原始值？

我有一个数据框 df pd DataFrame name george age 23 name anna age 26 现在我想检索乔治的年龄 df df name george age 但这会输出一些额外的信息以及原始值 0 23 Nam
ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

我想抓取百年灵网站上的产品页面以获取各种信息示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
Tipfy：如何在模板中显示blob？

鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像的模板标签是什么在这种情况下斑点是一个图像这很棒
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
Python 中的字符串slugification

我正在寻找 slugify 字符串的最佳方法蛞蝓是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code

随机推荐

如何从 Web 服务 JSON 数组或对象反序列化？

我在 Windows Phone 7 中创建了一个 Web 服务应用程序这是从下面的 uri 获取的 JSON 数组 id 4 name 班加罗尔 id 1 name 钦奈 id 3 name 海得拉巴 id 2 name 孟买 List
如何实现从一个进程到另一个进程的快速上下文切换？

我需要在沙箱进程上运行不安全的本机代码并且需要减少进程切换的瓶颈两个进程控制器和沙箱共享两个自动重置events http msdn microsoft com en us library windows desktop aa964
为什么 C 允许缺少函数声明？

今天我们遇到了一个不寻常的现象一位同事在他的代码中调用了一个正常运行的函数这触发了 libc gethostbyname 中的段错误令人费解的是相同的函数在同一运行时的其他源文件中运行没有问题令人惊讶的是当使用 valgrind
如何使用 OpenCV Viz 和 ARUCO 转换增强现实应用的 3D 模型

我正在开发一个简单的基于标记的增强现实应用程序OpenCV 可视化 and ARUCO 我只想在标记上可视化 3D 对象 PLY 格式我可以使用 ARUCO 毫无问题地运行标记检测和姿态估计返回旋转和平移向量我可以在 Viz 窗口中可
如何将函数的python代码打印到终端？ [复制]

这个问题在这里已经有答案了我有一个系统在其中我不断地试验函数的内容然后运行程序由于我经常打开许多终端窗口因此有时我并不确切知道哪个版本的函数属于哪个终端窗口有没有办法将特定函数的源代码打印到终端好吧感谢 Hoopdady 在
重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列

我有一个数据库其中包含 1 分钟的交易数据条目包括开盘价最高价最低价和收盘价我想创建一个函数删除某些时间戳以仅保留 30m 条目但是需要更新该时间戳的值以反映新的周期我执行了以下代码但有一个问题 def time sta
调用 Objective-C 函数时将值返回给 JavaScript

我一直在使用WebViewJavascriptBridge https github com marcuswestin WebViewJavascriptBridge在 iOS 应用程序中桥接 Objective C 和 JavaScrip
IF 语句中值之前或之后的变量

这两种说法有区别吗 if a hello and if hello a 我注意到像 Wordpress 这样的应用程序倾向于使用后者而我通常使用前者我似乎记得不久前读过一些文章为后者提供了理由但我不记得其背后的推理没有区别使用它
C# 字符串比较方法返回第一个不匹配的索引

是否存在现有的字符串比较方法该方法将根据两个字符串之间第一次出现的不匹配字符返回一个值 i e string A 1234567890 string B 1234567880 我想返回一个值让我可以看到匹配中断的第一次出现是 A 8
如何在 Xcode 中 #include

include
css word-wrap：断词不起作用

我有两个内联跨度代码示例 div class comment content span class comment author span span class comment text span div 和 scss 示例 commen
从 AJAX 请求获取页面内容后，我可以选择标签元素，但无法选择正文元素

我通过 AJAX 请求获得了一个 html 页面 ajax async true method GET url linkPage cache true success function data console log data 我得到的数
无法绑定到“x”，因为它不是“y”的已知属性

我有一个有角度的站点其中包含另一个组件内的一个组件我正在使用路由和延迟加载外部组件 ComponentA 内部组件 ComponentB 取决于第 3 方指令这是概念证明 https plnkr co edit 7maVz2vO9LK
JavaScript：JSLint 错误“for in 的主体应包含在 if 语句中，以过滤原型中不需要的属性”

我正在使用JSLint http JSLint com确保我的 JavaScript 是严格的的工具我收到以下错误但不明白如何修复它 The body of a for in should be wrapped in an if s
需要更快的滚动应用函数以及开始停止索引

下面是一段代码它给出滚动 15 分钟历史窗口的交易价格水平的百分位如果长度为 500 或 1000 它运行得很快但正如您所看到的有 45K 个观测值对于整个数据来说它的运行速度非常慢我可以应用任何 plyr 功能吗欢迎任
如何将具有单个值的用户定义列添加到 SQL 查询

我目前有一个 SQL 查询它生成一个包含大约 10M 行的表我想将此表附加到另一列该列对所有 10M 行具有相同的条目作为示例请考虑以下玩具查询 SELECT PRODUCT ID ORDER QUANTITY FROM PROD
在 py.test 中的每个测试之前和之后运行代码？

我想在测试套件中的每个测试之前和之后运行额外的设置和拆卸检查我看过固定装置但不确定它们是否是正确的方法我需要在每次测试之前运行设置代码并且需要在每次测试后运行拆卸检查我的用例是检查未正确清理的代码它会留下临时文件在我的设置中
TypeScript 类装饰器获取类名

我试图在运行时在类装饰器中获取类的名称缩小当我这样做时 const metadata Reflect getMetadata design type target constructor 我变得不确定我需要知道类名而不是缩小值我认为
Objective C - 获取今天（明天）的第二天

如何检查某个日期是否本质上是明天我不想在像今天这样的日期上添加时间或任何内容因为如果今天已经22 59 添加太多会延续到后天添加太少则时间到了12 00会错过明天我怎样才能检查两个NSDate并确保其中一个相当于另一个的明天 Us
Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组

我有这个带有目标的数据集LULUS 这是一个不平衡数据集我正在尝试打印roc auc如果我可以对数据的每个折叠进行评分但在每个折叠中不知怎的它总是会引发错误说ValueError y should be a 1d array got

Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组

Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组 的相关文章

随机推荐

热门标签

Sklearn ROC AUC 分数：ValueError：y 应该是一个一维数组，而是一个形状为 (15, 2) 的数组的相关文章