召回率和精确率后的分类准确率

2023-12-21

我只是想知道这是否是计算分类准确性的合法方法：

获取精确召回阈值
对于每个阈值，对连续 y_scores 进行二值化
从列联表（混淆矩阵）计算它们的准确性

返回阈值的平均准确度

recall, precision, thresholds = precision_recall_curve(np.array(np_y_true), np.array(np_y_scores))
accuracy = 0
for threshold in thresholds:
    contingency_table = confusion_matrix(np_y_true, binarize(np_y_scores, threshold=threshold)[0])
    accuracy += (float(contingency_table[0][0]) + float(contingency_table[1][1]))/float(np.sum(contingency_table))

print "Classification accuracy is: {}".format(accuracy/len(thresholds))

您正朝着正确的方向前进。混淆矩阵绝对是计算分类器准确性的正确起点。在我看来，您的目标是接收器的操作特性。

在统计学中，接收器操作特性 (ROC) 或 ROC 曲线是说明二元分类器系统在判别阈值变化时的性能的图形。https://en.wikipedia.org/wiki/Receiver_operating_characteristic https://en.wikipedia.org/wiki/Receiver_operating_characteristic

AUC（曲线下面积）是分类器性能的衡量标准。更多信息和解释可以在这里找到：

https://stats.stackexchange.com/questions/132777/what-does-auc-stand-for-and-what-is-it https://stats.stackexchange.com/questions/132777/what-does-auc-stand-for-and-what-is-it

http://mlwiki.org/index.php/ROC_Analysis http://mlwiki.org/index.php/ROC_Analysis

这是我的实现，欢迎您改进/评论：

def auc(y_true, y_val, plot=False):  
#check input
if len(y_true) != len(y_val):
    raise ValueError('Label vector (y_true) and corresponding value vector (y_val) must have the same length.\n')
#empty arrays, true positive and false positive numbers
tp = []
fp = []
#count 1's and -1's in y_true
cond_positive = list(y_true).count(1)
cond_negative = list(y_true).count(-1)
#all possibly relevant bias parameters stored in a list
bias_set = sorted(list(set(y_val)), key=float, reverse=True)
bias_set.append(min(bias_set)*0.9)

#initialize y_pred array full of negative predictions (-1)
y_pred = np.ones(len(y_true))*(-1)

#the computation time is mainly influenced by this for loop
#for a contamination rate of 1% it already takes ~8s to terminate
for bias in bias_set:
    #"lower values tend to correspond to label −1"
    #indices of values which exceed the bias
    posIdx = np.where(y_val > bias)
    #set predicted values to 1
    y_pred[posIdx] = 1
    #the following function simply calculates results which enable a distinction 
    #between the cases of true positive and  false positive
    results = np.asarray(y_true) + 2*np.asarray(y_pred)
    #append the amount of tp's and fp's
    tp.append(float(list(results).count(3)))
    fp.append(float(list(results).count(1)))

#calculate false positive/negative rate
tpr = np.asarray(tp)/cond_positive
fpr = np.asarray(fp)/cond_negative
#optional scatterplot
if plot == True:
    plt.scatter(fpr,tpr)
    plt.show()
#calculate AUC
AUC = np.trapz(tpr,fpr)

return AUC

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

machinelearning

Classification

召回率和精确率后的分类准确率的相关文章

使用 Django 的 post_save() 信号

我有两张桌子 class Advertisement models Model created at models DateTimeField auto now add True author email models EmailField
如何用 python 和 sympy 解决多元不等式？

我对使用 python 和 Sympy 还很陌生并且遇到了使用 sympy 解决多元不等式的问题假设我的文件中有很多函数如下所示 cst sqrt x 2 cst exp sqrt cst x 1 4 log log sqrt cst
类属性在功能上依赖于其他类属性

我正在尝试使用静态类属性来定义另一个静态类属性我认为可以通过以下代码来实现 f lambda s s 1 class A foo foo bar f A foo 然而这导致NameError name A is not defined
Python 中 genfromtxt() 的可变列数？

我有一个 txt具有不同长度的行的文件每一行都是代表一条轨迹的一系列点由于每条轨迹都有自己的长度因此各行的长度都不同也就是说列数从一行到另一行不同据我所知 genfromtxt Python 中的模块要求列数相同 gt gt g
Python：当前目录是否自动包含在路径中？

Python 3 4 通过阅读其他一些 SO 问题似乎如果moduleName py文件位于当前目录之外如果要导入它必须将其添加到路径中sys path insert 0 path to application app folder
Python3 查找 2 个列表中有多少个差异才能相等

假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到其中有多少项list2应该改变以便它等于lis
当x轴不连续时如何删除冗余日期时间 pandas DatetimeIndex

我想绘制一个 pandas 系列其索引是无数的 DatatimeIndex 我的代码如下 import matplotlib dates as mdates index pd DatetimeIndex 2000 01 01 00 00
如何使用机器学习从数据序列计算状态图？

通用配方我有一个由一系列点组成的数据集每个点有 12 个特征我有兴趣检测此数据中的事件在训练数据中我知道事件发生的时刻当事件发生时我可以在事件发生之前的点序列中看到可观察到的模式该形态由大约 300 个连续点形成我感兴趣的是
反加入熊猫

我有两个表我想附加它们以便仅保留表 A 中的所有数据并且仅在其键唯一时添加表 B 中的数据键值在表 A 和 B 中是唯一的但在某些情况下键将出现在表 A 和 B 中我认为执行此操作的方法将涉及某种过滤联接反联接以获取表 B
Pandas：根据列名进行列的成对乘法

我有以下数据框 gt gt gt df pd DataFrame ap1 X 1 2 3 4 as1 X 1 2 3 4 ap2 X 2 2 2 2 as2 X 3 3 3 3 gt gt gt df ap1 X as1 X ap2 X a
Python unicode 字符代码？

有没有办法将 Unicode 字符插入 Python 3 中的字符串例如 gt gt gt import unicode gt gt gt string This is a full block s unicode charcode U
字典的嵌套列表

我正在尝试创建dict通过嵌套list groups Group1 A B Group2 C D L y x 0 for y in x if y x 0 for x in groups d k v for d in L for k v in
负整数的Python表示

gt gt gt x 4 gt gt gt print b format x x 4 100 gt gt gt mask 0xFFFFFFFF gt gt gt print b format x mask x mask 4294967292
在 pip.conf 中指定多个可信主机

这是我尝试在我的中设置的 etc pip conf global trusted host pypi org files pythonhosted org 但是它无法正常工作参考 https pip pypa io en stable
python中的sys.stdin.fileno()是什么

如果这是非常基本的或之前已经问过的我很抱歉我用谷歌搜索但找不到简单且令人满意的解释我想知道什么sys stdin fileno is 我在代码中看到了它但不明白它的作用这是实际的代码块 fileno sys stdin filen
是否可以写一个负的python类型注释

这可能听起来不合理但现在我需要否定类型注释我的意思是这样的 an int Not Iterable a string Iterable 这是因为我为一个函数编写了一个重载而 mypy 不理解我我的功能看起来像这样 overload
Python模块单元测试的最佳文件结构组织？

遗憾的是我发现有太多方法可以在 Python 中保存单元测试而且它们通常没有很好的文档记录我正在寻找一种终极结构它可以满足以下大部分要求 be discoverable by test frameworks including
将 Scikit-Learn OneHotEncoder 与 Pandas DataFrame 结合使用

我正在尝试使用 Scikit Learn 的 OneHotEncoder 将 Pandas DataFrame 中包含字符串的列替换为 one hot 编码的等效项我的下面的代码不起作用 from sklearn preprocessin
PyQt 中的线程和信号问题

我在 PyQt 中的线程之间进行通信时遇到一些问题我使用信号在两个线程发送者和监听者之间进行通信发送者发送消息期望被监听者接收但是没有收到任何消息谁能建议可能出了什么问题我确信这一定很简单但我已经环顾了几个小时但没有发现
使用“pythonw”（而不是“python”）运行应用程序时找不到模块

我尝试了这个最小的例子 from flask import Flask app Flask name app route def hello world return Hello World if name main app run deb

随机推荐

如何获取已加载的 JNI 库的列表？

正如主题所说 Java 中有没有一种方法可以获取在任何给定时间加载的所有 JNI 本机库的列表免责声明请注意这个解决方案总是很hackish 现在在大多数情况下将不再起作用查看本杰明的回答 https stackoverflow c
使用 Java SDK、连接模式访问 Azure 服务总线

有几个使用 C 配置服务总线环境以使用 http https 的示例使用以下调用 ServiceBusEnvironment SystemConnectivity Mode ConnectivityMode Http 我的问题是可以以及
我如何设计一个数据库，用户可以在其中定义 M-D 关系中的详细表的字段和类型？

我的应用程序有一个名为 events 的表每个事件在 eventdata 表中都有大约 30 个标准字段而且还有可以是任何名称或类型的用户定义字段用户可以通过指定 x 个字段文本双精度日期时间布尔值以及这些字段的名称来定义这
无法在 Google Cloud SQL (MySQL) 上存储特殊字符

我有两个 MySQL 实例本地实例和 Google Cloud SQL 实例使用字符集在两者上创建相同的数据库utf8mb4 当我运行时可以验证 show variables like character set database 同样
将 lift-json 提取到具有上限的案例类中

我花了最后一天的时间搜索和阅读各种网站和文章试图自己找到这个问题的答案但我没有找到任何有帮助的东西我什至不确定这是否可行我的问题是我正在尝试使用 lift json 解析和提取 Json 响应响应由 4 部分组成其中前 3 部分
使用vba，是否可以从同一文件夹打开多个Excel工作簿并同时保持打开状态？

这不是我第一次问这个问题但我稍微改变了细节希望能让它更清楚这是我尝试过的代码的一个版本 Private Sub OpenWbsInPath zPath As String Dim zFile As String zPath IIf R
从 celery 任务中调用 async_result.get()

我有一个芹菜任务调用另一个任务remote任务它在不同的芹菜应用程序上在另一台服务器上当我尝试从我的任务中 get 获取远程任务的结果时如下所示 app task def my local task result from remo
使用 javascript 检测用户的区域设置是否设置为 12 小时或 24 小时时间格式

如何使用 Javascript 检查用户是否使用 12 小时或 24 小时时间格式无论是否使用第三方库如 moment js 我也尝试过new Date toLocaleString 但它没有在 Firefox 和 google chr
无法启动“./qemu/linux-x86_64/qemu-system-i386”：没有这样的文件或目录

使用 25rc1 SDK 工具时我在从 PATH 启动模拟器时遇到问题 which emulator home ligi bin android sdk tools emulator emulator M Could not launch
检测iframe内SPA（单页应用程序）的URL变化

我有一个渲染 iframe 的 React Web 应用程序 iframe 显示简单的网站或 SPA 网站我想在每次 iframe 中的 URL 发生变化时调用一个函数多个解决方案正在使用 onLoad 但这不适用于我检查过的 SPA
配置 nginx 和 uwsgi 时出现“没有此类文件或目录”错误

更新如果我不使用套接字并使用127 0 0 1 3031相反一切正常 Nginx版本是1 6 3 uwsgi是2 0 11 1 etc uwsgi ini uwsgi uid uwsgi gid uwsgi pidfile run uw
Docker-Compose 上的 InfluxDB 无法读取 SSL 证书文件

我在尝试使用在 Docker Compose 上运行的 InfluxDB v1 8 配置 SSL 时遇到一些问题我跟着官方文档 https docs influxdata com influxdb v1 8 administration
Matlab：是否可以创建信号处理程序（.m 脚本）

我查看了文档等但没有看到任何明显的东西我想要一个可以拦截的信号处理程序 C 或其他一些可用于中断长时间运行的脚本每个离散计算通常 Matlab 确实有 COM 的事件处理程序但它仅限于 Windows 而我处于 nix 环境中如果
在 AutoHotkey 中按住鼠标左键

I want a script where pressing F1 makes AutoHotkey hold down the left mouse button I then want the script to release the
“事件驱动”和“面向对象”编程之间的关系是什么？

如今我几乎到处都听到事件驱动编程维基百科说在计算机编程中事件驱动编程是一种编程范例其中程序的流程由用户操作鼠标单击按键传感器输出或来自其他程序线程的消息等事件确定事件驱动编程是图形用户界面和其他应用程序例如 Jav
UIPicker 检测当前选定行上的点击

我有一个UIPickerView和方法didSelectRow点击 a 时不会调用选定的行我需要处理这个案子有任何想法吗首先使类符合UIGestureRecognizerDelegate协议然后在视图设置中 UITapGestu
Python CSV 阅读器返回行作为列表

我正在尝试使用 python 解析 CSV 并希望能够对一行中的项目进行索引以便可以使用以下命令访问它们row 0 row 1 等等到目前为止这是我的代码 def get bitstats url http bitcoincharts
Swift 将数据从子视图发送到父视图控制器

我正在开发一个应用程序其中有一个视图控制器和子视图在子视图上我正在加载谷歌地图在主视图上我有一个标签我的问题是如何将数据从子视图地图地理位置传递到主视图上的标签并在使用 Swift 更新位置时更新该数据我发现的所有教程都使用
时间：2019-05-17 标签：c#progressbarnotupdate

我有一个 ProgressBarWindow 它有一个进度条和一个取消按钮我用它来报告文件 I O 的进度然而尽管所有工作都是在后台工作人员中完成的但 ProgressBarWindow 的 UI 线程和我的主窗口都挂起进度条已渲
召回率和精确率后的分类准确率

我只是想知道这是否是计算分类准确性的合法方法获取精确召回阈值对于每个阈值对连续 y scores 进行二值化从列联表混淆矩阵计算它们的准确性返回阈值的平均准确度 recall precision thresholds prec

召回率和精确率后的分类准确率

召回率和精确率后的分类准确率 的相关文章

随机推荐

热门标签

召回率和精确率后的分类准确率的相关文章