推荐系统评价指标/ROC/AUC（附代码）

2023-05-16

推荐系统评价指标

精确率：
分类正确的正样本数 / 分类器判定为正样本数
召回率：
分类正确的正样本数 / 真正的正样本数
在排序问题中，Top N就是模型判定的正样本，然后计算前N个位置上的准确率Precision@N和前N个位置上的召回率Recall@N。
P-R曲线
横轴是召回率，纵轴是精确率。P-R曲线上一个点代表着，某一阈值下，模型将大于该阈值的结果判为正样本，小于该阈值的为负样本，此时返回结果对应的召回率和精确率。整条曲线是通过将阈值从高到低移动而生成的。
怎么样通过P-R曲线判断分类器性能？
曲线A完全包住曲线B，那么A好。或平衡点（P=R）的取值较大，说明分类器性能好。
F1 score
精准率和召回率的调和平均值：F1=2precisionrecall / (precision+recall)

！！！重要的——ROC曲线
横坐标假阳性率FPR=FP / N，纵坐标真阳性率TPR=TP / P。
混淆矩阵核心：TP、TN、FP、FN（记忆小trick：预测的是后面的字母）
在这里插入图片描述
N是真实负样本数，FP是N个负样本中被分类器预测为正样本的个数；P是真实正样本数，TP是P个正样本中被分类器预测为正样本的个数。
如何绘制ROC曲线？
”截断点“由高到低，每个截断点都会对应一个FPR和TPR。在二值分类问题当中，”截断点“指的就是区分正负预测结果的阈值。依次调整截断点，直到画出全部的关键点。
另一种直观绘图方法：
横轴间隔1/N，纵轴间隔1/P；根据模型输出的预测概率对样本进行排序（从高到低）；依次遍历样本，遇到一个正样本就沿纵轴绘制一个间隔的曲线，遇到一个负样本就沿横轴绘制。直到遍历完全部样本，曲线最终停留在（1，1）。
ROC曲线相比P-R曲线有什么特点？
当正负样本分布发生变化时，ROC曲线的形状能基本保持不变。这个特点让ROC曲线能够尽量降低不同测试集带来的干扰，更加客观地衡量模型本身的性能。当想要看到的是模型在特定数据集上的表现，P-R曲线能更直观地反映性能。

如何计算AUC？
AUC是ROC曲线下的面积大小，一般在x=y的上面，取值范围0.5~1。AUC越大，说明模型越可能把真正的正样本排在前面，分类性能越好。AUC对正负样本比例不敏感，说明：ROC曲线横轴FPR只关注负样本，与正样本无关；纵轴TPR只关注正样本，与负样本无关。横纵轴都不受正负样本比例影响，积分当然也不受其影响。

重要！！！手撕AUC
参考的是这位大佬：
https://www.jianshu.com/p/f9f8e29abbe0
从计算概率的角度理解AUC，随机抽出一对样本（一个正样本，一个负样本），然后用训练得到的分类器来对这两个样本进行预测，预测得到正样本的概率大于负样本概率的概率。
在这里插入图片描述
在有M个正样本，N个负样本的数据集里：
一共有MxN对样本（一对样本即，一个正样本与一个负样本），先统计这MxN对样本里，正样本的预测概率大于负样本的预测概率的个数。
举例如下

假设有4条样本。2个正样本，2个负样本，那么MxN=4。
即总共有4个样本对。分别是：
(C,A), (C,B), (D,A), (D,B)

在（C,B）样本对中，正样本C预测的概率小于负样本B预测的概率（也就是C的得分比B低），记为0
在（D,B）样本对中，正样本D预测的概率大于负样本B预测的概率（也就是D的得分比B高），记为1
所以最后的AUC结果即为：
(C,A), (C,B), (D,A), (D,B) =1+0+1+1
总样本对为MxN=4
所以结果为：（1+0+1+1）/4=0.75
如果样本对中正负样本的得分一样，I值取0.5。

import numpy as np
from sklearn.metrics import roc_auc_score

def calcAUC(labels, probs):
    N = 0
    P = 0
    neg_prob = []
    pos_prob = []
    for _, i in enumerate(labels):
        if i == 1:
            P += 1
            pos_prob.append(probs[_])
        else:
            N += 1
            neg_prob.append(probs[_])
    number = 0
    for pos in pos_prob:
        for neg in neg_prob:
            if pos > neg:
                number += 1
            elif pos == neg:
                number += 0.5
    return number / (N * P)


y = np.array([1, 0, 0, 0, 1, 0, 1, 0])
pred = np.array([0.9, 0.8, 0.3, 0.1, 0.4, 0.9, 0.66, 0.7])
print('auc=', calcAUC(y, pred))
print('roc_auc=', roc_auc_score(y, pred))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

随机推荐

从零开始 CMake 学习笔记（F）Build Type

从零开始 CMake 学习笔记 xff08 F xff09 Build Type 开始前先默念三遍口诀 xff1a Declare a targetDeclare target s traitsIt s all about targets
利用tf.reset_default_graph()重置default graph计算图以及nodes节点

import tensorflow as tf tf reset default graph 利用这个可清空defualt graph以及nodes with tf variable scope Space a a 61 tf consta
c++继承多态知识感悟

组合与继承先说说组合 xff0c 当设计一个新的类的时候 xff0c 可以将一个已有类的对象作为成员 xff0c 然后通过成员对象实现已有类的功能 xff0c 类的对象成员与内置类型数据成员的声明语法一样我们很早就开始接触并使用了再说
Win10+Ubuntu18.04双系统安装教程

一说在前头不同的配置安装方法不同 xff0c 我也是小白第一次安 xff0c 也是看了无数个教程不断重安了无数次才成功的 xff0c 所以我的教程不一定适合你的配置 xff0c 但你可以耐心的按照我的思路尝试 xff0c 如果你有更好的
ROS中的package.xml的使用

文章目录 package xml作用package xml写法来自VINS mono中 vins estimator package xml作用 pacakge xml 包含了package的名称版本号内容描述维护人员软件许可编
五、VINS-mono 代码解析——VIO初始化之SFM详解

文章目录前言系统流程图Estimator类processImage 函数initialStructure 初始化函数SFM初始化relativePose 函数getCorresponding 函数返回两帧匹配特征点3D坐标solveRel
嵌入式软件工程师的四项基本能力

能力1 xff1a 对C语言的深入掌握 xff0c 不犯低级语法错误能力2 xff1a 对嵌入式芯片平台熟悉 xff0c 包括芯片各类外设的原理和使用方法 xff0c 以及相应的嵌入式操作系统还包括芯片外围电路的设计能力 xff0c 包
windows中cuda版本切换

一安装 xff1a cuda的安装教程较多 xff0c 可以参考的博客 xff1a https blog csdn net zsc201825 article details 91129403 安装后的默认地址 xff1a C Progr
阿里云配置ubuntu图形化界面

购买阿里云ECS服务器 xff1a 阿里云官网地址 xff1a https www aliyun com 点击云服务器ECS xff0c 根据自身情况进行选购购买后点击控制台 xff0c 找到实例 xff1a 找到自己的服务器实例 xff
‘labelme‘ 不是内部或外部命令，也不是可运行的程序问题解决

文章目录一安装labelme1 创建虚拟环境2 安装pyqt支持库3 安装Labelme 二 lableme启动一安装labelme 1 创建虚拟环境命令行输入 conda create span class token oper
超9成SCI论文发在国外！中文期刊到底差在哪？

来源科学网撰文卜叶编辑宗华学术界不投中文期刊的原因是什么 xff1f 这一老生常谈的问题 xff0c 最近再次出现在某知识问答平台热榜短短两周 xff0c 便吸引了180个回答 xff0c 浏览量超过34万中文期刊到底差在哪
detectron2入门学习一：实现FruitsNut水果坚果分割任务以源码阅读

学习目标 xff1a 学习detectron2数据集的注册以及基本的训练推理一工程文件下载与数据集准备 xff1a 整体的工程文件下载地址 xff1a https github com fenglingbai FruitsNutSeg
error: command ‘C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v10.1\\bin\\nvcc.exe‘ failed

项目场景 xff1a 在win10 CUDA10 1 xff0c pytorch 61 1 8 1 第三方库Detectron2 version 61 61 0 6 安装后进行编译时 python setup span class toke
移植已有的python环境至远程服务器(不需要联网重新下载相关环境)

一 xff1a conda pcak使用 xff1a 由于实验室服务器不能联网 xff0c 唯一的方法是使用系统代理 xff0c 方法可以使用 ccproxy xff0c 这个可以在后续博客中介绍 xff0c 但该方法还是需要重新联网下载环
CloudCompare点云配准基本操作

CloudCompare基本介绍官方网站 https cloudcompare org 官方文档 https cloudcompare org doc qCC CloudCompare 20v2 6 1 20 20User 20manua
mmsegmentation实战一：ISBI2012数据实战

文章目录一数据格式转换二 dataset class文件配置 xff1b 1 设置数据集文件2 修改mmseg datasets 目录下的 init py 三在configs base datasets下面对数据加载进行定义四在co
四、功能包的创建

一创建工作空间 1 新建文件夹 2 在工作空间中创建src文件夹 3 进入src文件夹 xff0c 打开终端 4 输入 catkin init workspace 初始化工作空间 xff0c 产生一个文件 xff0c 告诉系统这是一个工作
十、参数服务器之参数的修改实现

1 背景简介在项目中 xff0c 有一些功能是通过参数服务器实现的有事 xff0c 需要修改相应的参数 xff0c 这时 xff0c 我们就可以通过相关命令来获取相应参数 xff0c 进而修改相应的参数 2 实现步骤 1 参数名获取 r
deepsort C++代码关于卡尔曼滤波的一些思考

卡尔曼滤波公式 xff1a 以上公式 xff0c 在C 43 43 代码中 xff0c 状态估计x用mean表示 xff0c 协方差P用covariance表示 xff0c 状态转换模型F用 motion mat表示 xff0c 观测模型H
推荐系统评价指标/ROC/AUC（附代码）

推荐系统评价指标精确率 xff1a 分类正确的正样本数分类器判定为正样本数召回率 xff1a 分类正确的正样本数真正的正样本数在排序问题中 xff0c Top N就是模型判定的正样本 xff0c 然后计算前N个位置上的准确率Pre

推荐系统评价指标/ROC/AUC（附代码）

推荐系统评价指标

推荐系统评价指标/ROC/AUC（附代码） 的相关文章

随机推荐

热门标签

推荐系统评价指标/ROC/AUC（附代码）的相关文章