是否可以检索由混淆矩阵识别的误报/误报？

2024-04-18

我正在使用 Scikit-learn 并使用混淆矩阵来更深入地了解我的算法的执行情况：

X_train, X_test, Y_train, Y_test = train_test_split(keywords_list, 

label_list, test_size=0.33, random_state=42)

pipeline.fit(X_train, Y_train)

pred = pipeline.predict(X_test)

print(confusion_matrix(Y_test, pred))

我得到这样的输出：

[[1011   72]
[ 154 1380]]

我假设遵循这些矩阵的格式：

TP|FP
FN|TN

是否可以检索被分类为误报和漏报的值？了解这些数据是什么样子对我的工作很有帮助。不用说，我是 Sckit-Learn 的新手。

EDIT:

亚历山德罗给了我很好的建议，他告诉我Y_test != pred将返回混淆矩阵中的所有误报/漏报。

我应该在最初的问题中提到的一个因素是我正在对二进制标签下的文本数据进行分类。（例如火腿/垃圾邮件），我想将它们彼此分开。我当前提取漏报的代码采用以下形式：

false_neg = open('false_neg.csv', 'w')
falsen_list = X_test[(Y_test == 'Spam') and (pred == 'Ham')] #False Negatives
wr2 = csv.writer(false_neg, quoting=csv.QUOTE_ALL)
for x in falsen_list:
    wr2.writerow([x])

不幸的是，这会引发错误：

  Traceback (most recent call last):
  File "/home/noname365/PycharmProjects/MLCorpusBlacklist/CorpusML_training.py", line 171, in <module>
    falsen_list = X_test[(Y_test == 'blacklisted') and (pred == 'clean')] #False Negatives
  File "/home/noname365/virtualenvs/env35/lib/python3.5/site-packages/pandas/core/generic.py", line 731, in __nonzero__
    .format(self.__class__.__name__))
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我走在正确的轨道上吗？

Y_test != pred给出你错误预测的答案特别(Y_test == 1) == (pred == 0)应该给你误报(Y_test == 0) == (pred == 1)应该给你假阴性（或者可能是相反的情况，具体取决于你的设置中的阳性和阴性）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

matrix

machinelearning

是否可以检索由混淆矩阵识别的误报/误报？的相关文章

如何从网站中抓取动态内容？

所以我使用 scrapy 从亚马逊图书部分抓取数据但不知何故我知道它有一些动态数据我想知道如何从网站中提取动态数据到目前为止我已经尝试过以下方法 import scrapy from items import AmazonsItem
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
将字段重新格式化为列，其他字段（与先前结构中成为列的字段配对）成为新列中的字段

我的任务是清理慈善机构设计的移动应用程序中的数据在一个部分中用户问答应用程序使用会话由一行表示该部分由重复的问题答案字段对组成其中一个字段代表所提出的问题然后它旁边的字段代表相应的答案每个问题字段和答案列对一起代表一个独特的问
通过 rpy 将 SPSS 文件（.sav）导入 pandas 时如何保留标签？

我正在寻找使用 SPSS 文件 sav pandas 在没有 SPSS 程序的情况下典型文件转换为 csv 后的样子如下在调查前两行的含义时我不知道 SPSS 似乎第一行包含Labels 而第二行包含VarNames 当我将文件带入
如何创建毫秒粒度的 Python 时间戳？

我需要一个自纪元以来的毫秒 ms 时间戳这应该不难我确信我只是缺少一些方法datetime或类似的东西实际上微秒 s 粒度也很好我只需要亚 1 10 秒的计时例子我有一个每 750 毫秒发生一次的事件假设它检查灯是否打开或关闭
Python gdal 未定义符号 GDALRasterBandGetVirtualMem

我正在尝试使用Python GDAL 绑定 https pypi python org pypi GDAL 通过 pip 天真地安装绑定时安装失败并显示错误 VSIFTruncateL 未在此范围内声明 https gis stackex
从内存中发送图像

我正在尝试为 Discord 机器人实现一个系统该系统可以动态修改图像并将其发送给机器人用户为此我决定使用 Pillow PIL 库因为它对于我的目的来说似乎简单明了这是我的工作代码的示例它加载一个示例图像作为测试修改在其上
从另一个文件覆盖函数中的变量

一总结我不知道如何从另一个文件覆盖函数中的变量 2 示例 2 1 配置 I use logbook http logbook pocoo org and pyfancy https github com ilovecode1 Pyfan
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
将 pandas 多索引数据帧转换为嵌套字典

我有一个 pandas 多索引数据框我试图将其输出为嵌套字典 create the dataset data clump thickness 0 0 274 0 0 1 19 0 1 0 67 0 1 1 12 0 2 0 83 0 2
如何在 Python for 循环中获取 GAE ndb 中当前记录的密钥？

我目前有一个网页其中显示数据存储中的记录列表以及编辑链接我想从数据库转换它至新开发银行我是 Python 和 GAE 新手当前代码 tbody for listtype in listtypes tr td listtype Li
Buildozer Numpy RuntimeError：工具链损坏：无法链接简单的 C 程序

用 Python 编写我的第一个 Android 应用程序并使用 Buildozer 对其进行打包因为稍后在项目中需要使用numpy 所以我尝试打包以下测试代码 import numpy import kivy kivy require
有效地写入 pandas 中的多个相邻列

使用 numpy ndarray 可以一次写入多个列而无需先进行复制只要它们相邻如果我想写入数组的前三列我会写 a 0 0 3 1 2 3 this is very fast a is a numpy ndarray 我希望在 pa
Tkinter 按钮鼠标右键和左键单击有不同的命令

我正在用 Python 制作扫雷游戏并使用 tkinter 库来创建 gui 有没有绑定到 tkinter 按钮两个命令的方法一个是右键单击按钮时的命令另一个是单击左键时的命令通常按钮仅设计用于单击但 tkinter 允许您为
创建 df 以生成给定格式的 json

我正在尝试生成一个 df 来生成下面的 json Json数据 name flare children name K1 children name Exact size 4 name synonyms size 14 name K2 chi
将 Selenium 与 PyCharm CE 结合使用

我正在尝试将 Selenium 与 PyCharm CE 一起使用我已经使用 pip install Selenium 安装了 Selenium 并且可以通过终端使用它但是当我尝试将它与 PyCharm 一起使用时出现导入错误 Imp
如何在Python中获取套接字的外部IP？

当我打电话时socket getsockname 在套接字对象上它返回我的机器的内部 IP 和端口的元组但是我想找回我的外部IP 最便宜最有效的方式是什么如果没有外部服务器的配合这是不可能的因为您和另一台计算机之间可能存在任意
了解字典的深度

假设我们有这个字典 d a 1 b c 了解嵌套的最直接方法是什么depth of it 您需要创建一个递归函数 gt gt gt def depth d if isinstance d dict return 1 max map dept
出于安全目的，您是否有理由不执行自己的算法来打乱 ID？

我计划实现我自己的非常简单的哈希公式为具有多个用户的应用程序添加一层安全性我目前的计划如下用户创建一个帐户此时后端会生成一个 ID ID 通过公式运行假设 ID 57 8926 36 7 或同样随机的东西然后我将新的用户
使用枚举名称而不是值对 Pydantic 字段进行编码

我有一个枚举类 class Group enum Enum user 0 manager 1 admin 2 我有一个 pydantic 模型 class User BaseModel id int username str group G

随机推荐

将字符串传递给 settimeout 是不好的做法吗？如果是，为什么？ [复制]

这个问题在这里已经有答案了可能的重复是否有充分的理由将字符串传递给 setTimeout https stackoverflow com questions 6081560 is there ever a good reason to
无法获取动态导入的模块：

我有一些延迟导入的 React 组件App tsx App tsx用于Index tsx它被渲染并附加到的地方body const IndexPage lazy gt import features IndexPage const Tags
在 Playstore 中发布现成的 Kivy 应用程序之前的流程？

我已经做了buildozer android debug并拥有 apk文件已安装并且工作正常至少针对一个两个设备进行了测试这也是半默认的buildozer spec 例如域名仍然是org test但随着应用程序的名称进行了调整有了
如何在可拖动和可放置之间划清界限？

我正在使用优秀的 JQuery UI 进行映射以便用户可以映射来自一个计划的人员与来自另一计划的人员使用这个简单的 JQuery document ready function div draggable draggable re
如何在 iOS 上检测设备的方向？

我有一个关于如何在 iOS 上检测设备方向的问题我不需要接收更改通知只需接收当前方向本身这似乎是一个相当简单的问题但我一直无法理解它以下是我到目前为止所做的 UIDevice myDevice UIDevice currentDe
插件 AppDomains 解决方法

在处理自己的子目录中的插件程序集时存在一个众所周知的问题一旦这些程序集尝试从其子目录加载各自的依赖项它们将无法加载解决方案是在 AppDomains 中加载插件PrivateBinPath设置在他们的AppDomainSetup初始
使用当前活动的 Google Drive 集成

是否可以在不创建自己的 Activity 的情况下与 Google Drive 集成而只是使用应用程序的当前 Activity 而不用 Google Drive 相关代码污染它我有一个后台服务不是 Android 服务只是一个与
非 www 到 www htaccess 重定向

我有一个 net 网址它与前面的 www 完美配合但是当网址只是http example net http example net它打开了一个正在建设的页面我尝试了各种 htaccess 文件但没有任何效果帮助我不是网络开发人员
CSS3 在动画元素上旋转导致不调用单击事件

好吧这个给我带来了很多问题使用css3时 webkit transform具有任何类型 3d 旋转的样式例如rotateY 30deg 给这个旋转的对象绑定点击事件是极其不可靠的请参阅下面的示例代码或查看这把小提琴 http jsf
序列化迁移执行顺序

我似乎无法在任何地方找到这个问题的答案我了解 Sequelize 迁移和播种器的工作原理但我没有找到任何地方说明它们是否按某种特定顺序执行因此如果我从一个数据库开始进行一系列迁移然后决定从原始起点初始化一个全新的数据库它将以完
如何在Android应用程序中实现应用内计费？

看来在Android应用程序中实现应用内计费是相当复杂的我怎么能这样做呢 SDK 中的示例应用程序只有一个 Activity 这对于像我这样具有多个 Activity 的应用程序来说过于简化了好吧我会尝试解释一下我的经历我不认为自己
Mac zip 压缩没有 __MACOSX 文件夹？

当我在 Mac OSX 中使用内置 zip 压缩器压缩文件时会导致在提取的 zip 中创建一个名为 MACOSX 的额外文件夹我可以调整设置以防止创建此文件夹吗或者我是否需要购买第三方压缩工具 UPDATE 我刚刚找到一个适用于 OS
使用 simplexml_load_file 从 tumblr 中提取 - 每次都会超时

我的网站加载时间约为 45 秒这是因为我从 tumblr 中提取了一些 XML 但我无法确定这是我的服务器的错误 tumblr 的错误还是其他因素我可以让这个脚本在 5 秒后超时并回显 tumblr 已关闭吗而不是在近一分钟后超时
等待CSS中的背景图像完全加载[重复]

这个问题在这里已经有答案了我有一个网络应用程序它使用外部 CSS 中加载的外部背景图像现在可以在图像完全渲染之前使用该应用程序从而产生奇怪的视觉效果如何停止脚本执行直到图像完全加载它可以使用普通的 JavaScript 或 j
如何复制hashset和hashmap，Java是否使用指针？

我有两个问题 First 我有一个返回 HashMap 的函数为了读取返回值我这样写 HashMap
Gradle 上传失败但仍部署到 Nexus

您好我的 gradle 构建失败了uploadArchives任务但是当我检查Nexus时 WAR和POM仍然成功部署到Nexus 谁能帮助我了解发生了什么事 26 Jul 2016 18 46 28 compileGroovy UP
用于从模式生成 URL 的 Java 库

我想知道是否有任何免费的 Java 库可以自动执行以下过程 1 提供遵循特定模式的 URL 例如 http www asite com path to something thischange alsothischange andthisc
在 Spring Boot 测试中的纯二进制 websocket 连接期间保留 TestSecurityContextHolder

我有一个使用二进制 websocket 的 spring boot 1 5 2 RELEASE 应用程序即没有 Stomp AMQP 纯二进制缓冲区在我的测试中我能够来回发送消息效果非常好但是在对应用程序进行 websocket
如何知道网络是否连接（断开）？

在 Xul 中我如何知道网络是否已连接断开 update Using function observe aSubject aTopic aState if aTopic network offline status changed wr
是否可以检索由混淆矩阵识别的误报/误报？

我正在使用 Scikit learn 并使用混淆矩阵来更深入地了解我的算法的执行情况 X train X test Y train Y test train test split keywords list label list test

是否可以检索由混淆矩阵识别的误报/误报？

是否可以检索由混淆矩阵识别的误报/误报？ 的相关文章

随机推荐

热门标签

是否可以检索由混淆矩阵识别的误报/误报？的相关文章