查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ）

2023-05-16

原文转载于： http://www.cnblogs.com/bluepoint2009/archive/2012/09/18/precision-recall-f_measures.html

在信息检索和自然语言处理中经常会使用这些参数，下面简单介绍如下：

准确率与召回率（Precision & Recall）

我们先看下面这张图来加深对概念的理解，然后再具体分析。其中，用P代表Precision，R代表Recall

一般来说，Precision 就是检索出来的条目中（比如：文档、网页等）有多少是准确的，Recall就是所有准确的条目有多少被检索出来了。

下面这张表介绍了True Positive，False Negative等常见的概念，P和R也往往和它们联系起来。

	Relevant	NonRelevant
Retrieved	true positives （tp）	false positives（fp）
Not Retrieved	false negatives（fn）	true negatives （tn）

那么，

$P=\frac{tp} {tp+fp} \hfill (1)$

$R=\frac{tp} {tp+fn} \hfill (2)$

我们当然希望检索的结果P越高越好，R也越高越好，但事实上这两者在某些情况下是矛盾的。比如极端情况下，我们只搜出了一个结果，且是准确的，那么P就是100%，但是R就很低；而如果我们把所有结果都返回，那么必然R是100%，但是P很低。

因此在不同的场合中需要自己判断希望P比较高还是R比较高。如果是做实验研究，可以绘制Precision-Recall曲线来帮助分析。

note by watkins:

下面我截取了一个P-R曲线做个展示，转载原文中没有。

F1-Measure

前面已经讲了，P和R指标有的时候是矛盾的，那么有没有办法综合考虑他们呢？我想方法肯定是有很多的，最常见的方法应该就是F-Measure了，有些地方也叫做F-Score，其实都是一样的。

F-Measure是Precision和Recall加权调和平均：

<span
$F = \frac{(a^2+1)P*R} {a^2(P+R)} \hfill (3)$

当参数a=1时，就是最常见的F1了：

<span
$F1 = \frac{2PR} {P+R} \hfill (4)$

很容易理解，F1综合了P和R的结果，当F1较高时则比较说明实验方法比较理想。

我的进一步补充：

在判断检索结果好坏时，查全率（Recall ratio）与查准率（Precision ratio）是两个最常用的指标。它们表示系统的“过滤能力”，即让相关文献“通过”，“阻止”无关文献。
　　查全率与查准率的定义如下：R（查全率）=（检出的相关文献数量/检索系统中相关文献总量）x100%，，P（查准率）=（检出的相关文献数量/检出的文献总量）x100% ——《文献检索与利用》—花芳
　　例如：在一次检索中，共检出文献100篇，经过专家判定，其中与提问相关的文献为60篇，其余的40篇为误检文献，那么按照上述公式，本次检索的查准率P就等于（60/100）×100%即60%。假如检索系统中还有90篇相关文献，由于各种原因而未被检出（漏检），那么按照上述公式，本次检索的查全率就等于（60/60+90）×100%即40%。
　　可见，利用上述公式，对每一次信息检索，都可计算出其查准率和查全率，对检索效率作出定量化的评价。
　　但是，如果进一步分析，就会发现查准率的计算没有问题，而查全率的计算存在明显的问题。那就是怎样知道漏检文献的数量。
　　对于小型的试验系统，在进行检索效率评价时，只要把系统中所有的文献都浏览一遍，就能准确地获得漏检文献的数量。然而，在实际运行的检索系统中，由于系统文献总量通常数以百万计，在评价检索效率时，根本不可能把浏览系统中所有的文献，因此，也就无法知道漏检文献数量。
　　所以，在实际的检索评价中，对于漏检文献数量，一般采用近似的估计值。获得漏检文献数量估计值的方法有两种：其一，利用其他的同类检索系统，进行相同的检索，然后通过对命中结果的分析和比较，推断哪些文献被漏检；其二，利用原有的检索系统，放大检索范围进行查找，然后对命中结果进行分析，看是否有原先未被检出的相关文献，从而得到漏检文献的近似值。
　　．查准率与查全率之间的关系
　　利用查准率和查全率指标，可以对每一次检索进行检索效率的评价，为检索的改进调整提供依据。利用这两个量化指标，也可以对信息检索系统的性能水平进行评价。
　　要评价信息检索系统的性能水平，就必须在一个检索系统中进行多次检索。每进行一次检索，都计算其查准率和查全率，并以此作为坐标值，在平面坐标图上标示出来。通过大量的检索，就可以得到检索系统的性能曲线。
　　———《文献检索与利用》陈老师

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ）的相关文章

为什么 0.1 + 0.1 == 0.2？

这是关于Java的据我了解由于二进制表示形式 Java 无法完美表示 0 1 这使得 0 1 0 1 0 1 0 3 错误的然而为什么 0 1 0 1 0 2 给出真实的由于二进制表示形式 0 1 无法用 Java 完美表示这使
View 的 getWidth() 和 getHeight() 返回 0

我看过类似的问题并尝试了他们的解决方案但它对我不起作用我正在尝试阅读width of an imageView 但它正在返回0 这是代码 public class MainActivity extends Activity privat
C# 中双精度数比浮点数快吗？

我正在编写一个应用程序它读取大量浮点数并用它们执行一些简单的操作我使用浮点数因为我认为它比双精度更快但经过一些研究后我发现这个主题存在一些混乱谁能详细说明一下吗简短的答案是使用可接受的结果所需的任何精度您的一项保证是对浮
单/多线程（OpenMP）模式下计算精度的差异

有人可以解释理解单多线程模式下计算结果的不同吗这是一个大约的例子圆周率的计算 include
在Python中确定特定数字的精度和小数位数

我在 Python 中有一个包含浮点数的变量例如num 24654 123 并且我想确定数字的精度和小数位数在 Oracle 意义上因此 123 45678 应该给我 8 5 12 76 应该给我 4 2 等等我首先考虑使用字符串表
为什么不使用基于二进制补码的浮点？

float64 32 和 16 的 IEEE 754 标准使用有符号尾数和有偏差指数作为一名设计硬件架构的学生对我来说对有效数和指数部分使用二进制补码更有意义例如定义 32 位半精度浮点数第一位表示符号接下来的 8 位指
在 PHP 中设置浮点数的精度

我从数据库中获取一个号码这个号码可能是float or int 我需要将数字的小数精度设置为3 这使得数字不长于关于小数 5 020 or 1518845 756 使用PHP round number precision 我看到一个问题
Python 中的机器 Epsilon

我目前正在学习的一本手册我是新手说相差小于机器 epsilon 的数字在数值上是相同的使用 Python 可以通过键入获得浮点值的机器 epsilon eps numpy finfo float eps 现在如果我检查 1 eps
浮点数学有问题吗？

考虑以下代码 0 1 0 2 0 3 gt false 0 1 0 2 gt 0 30000000000000004 为什么会出现这些不准确的情况 Binary 浮点 https en wikipedia org wiki Double p
C++除法精度不够如何提高结果精度

我正在研究莱布尼茨问题如图所示https www hackerrank com challenges leibniz https www hackerrank com challenges leibniz这里计算 1 1 3 1 5 1
Python 2 十进制的 Sin、cos 等？

在Python 2 6中我发现Decimal相当于sqrt pi is Decimal pi sqrt sin cos 或其他反三角函数是否有类似的函数 The docs http docs python org library de
为什么 bean 验证最小/最大约束不支持 double 类型？

有人可以向我解释一下为什么 JPA 支持doubletype 作为字段类型但 bean 验证约束javax validation constraints i e Min http java sun com javaee 6 docs ap
在 DAX 中进行测量以计算仅适用于 Power BI 的选定月份的年初至今

如何构建 DAX 度量来计算特定月份的 YTD 值总和这里我们有按月份分组的事实表 FactTable 填充了实际数据和预测数据了解实际结束时间的唯一方法是截止日期列年初至今中的信息在表截止日期列 YTD 结束中这是一
浮点精度显示（Android）

我正在尝试制作一个程序它接受一些用户输入运行一些计算并输出答案我的问题是这个答案有时会长很多小数位这会导致一些美观和布局问题我只需要显示小数点后 4 位的数据是否有办法在输出时限制这些数字的精度数字存储在浮点数中我正在为
Python 和/或 C/C++ 中的高精度算术？

摘要哪个 Python 包或 C 库是非常高精度算术运算的最佳选择我有一些转换小数天数的函数 0 0 0 99999 转换为人类可读的格式小时分钟秒但更重要的是毫秒微秒纳秒转换是通过以下函数完成的请注意我还没有实施时
精确存储大整数

在R软件中 a lt 123456789123456789123456789 sprintf 27f a 1 123456789123456791337762816 000000 我得到了错误的答案我想要准确的a value 为什么系统显
大浮点和的精度

我正在尝试对正递减浮点数的排序数组求和我发现对它们求和的最佳方法是开始从最低到最高将数字相加我编写此代码是为了提供一个示例但是从最高数字开始的总和更精确为什么当然 1 k 2之和应该是f 1 644934066848226 in
计算圆形数量级

对于一个简单的项目我必须使大数字例如 4294967123 可读因此我只写带有前缀的前几个数字 4294967123 gt 4 29G 12345 gt 12 34K 等代码简化如下所示 const char postfixes
Swift 的 Decimal 精度问题

根据文档here https developer apple com documentation foundation decimal Swift 3 4 Decimal 类型是以 10 为基数桥接到 NSDecimalNumber 的表示
float 和 double 精度相关的概念

为什么精度float小数点后最多 6 位精度double小数点后最多15位任何人都可以给一个数学解释 of it 说一下精度float or double是一些小数位数是草率的术语 float and double通常使用 IEEE 7

随机推荐

TCP流量控制和拥塞控制

先来了解2个TCP的概念 xff1a MSS xff1a Maximum Segment Size xff0c TCP一次传输发送的最大数据段长度 RTT xff1a Round Trip Time xff0c 往返时延 xff0c 表示从
c++static关键字的作用

c 43 43 static关键字的作用 c c 43 43 共有 1 xff09 xff1a 修饰全局变量时 xff0c 表明一个全局变量只对定义在同一文件中的函数可见 2 xff09 xff1a 修饰局部变量时 xff0c 表明该变量的
git合并解决

远程分支被修改了 xff0c 本地分支落后修改 xff0c 合并方法一 xff1a 在你自己的分支上 xff0c 如果有本地修改先 git stash git pull git merge origin master 如果本地分支是mas
TCP Keepalive

TCP Keepalive的起源 TCP协议中有长连接和短连接之分短连接环境下 xff0c 数据交互完毕后 xff0c 主动释放连接 xff1b 长连接的环境下 xff0c 进行一次数据交互后 xff0c 很长一段时间内无数据交互时 xf
【转载】深入浅出讲解FOC算法与SVPWM技术——自制FOC驱动器

原文链接 xff1a https zhuanlan zhihu com p 147659820 参考文献 xff1a https zhuanlan zhihu com p 364247816 https www zhihu com ques
Linux 基本用户和组命令

Linux 基本用户和组命令 1有关用户的命令 1 新增用户 Useradd 43 用户名 2 查看用户是否存在 id 43 用户名 3 删除用户 sudo userdel 用户名只会删除用户本身 sudo userdel r 43 用户
Linux文件及权限

Linux文件及权限 1 xff0e 查看文件权限 1 ls l 命令 ll 命令显示详细信息例 xff1a root 64 localhost Desktop ll total 178752 rwxr xr x 1 root root
各种排序算法和应用场景

简介插入排序插入排序是一种较为简单的排序算法 xff0c 它的基本思想是通过构建有序序列 xff0c 对于未排序数据 xff0c 在已排序序列中从后向前扫描 xff0c 找到相应位置并插入形象的可以理解为打扑克抓拍的过程 xff0c
C/C++(3)C++调用C语言的函数和头文件

C 43 43 语言支持函数重载 xff0c C语言不支持函数重载函数被C 43 43 编译后在库中的名字与C语言的不同 xff0c C xff0b xff0b 和C是两种完全不同的编译链接处理方式 xff0c 如果直接在C xff0b
一文了解IMU原理、误差模型、标定、惯性传感器选型以及IMU产品调研(含IMU、AHRS、VRU和INS区别)

在此记录一下测试IMU过程中的其它文章 xff0c 便于以后查看 xff1a IMU的误差标定以及姿态解算ROS下通过USB端口读取摄像头数据包括笔记本自带摄像头激光摄像头 IMU等传感器数据同步方法 message filters
windows安装Ubuntu子系统以及图形化界面记录

文章目录 1 windows环境设置2 开始安装3 ubuntu使用3 1 启动和退出 Linux 子系统3 2 安装位置3 3 更换源 4 安装图形化界面4 1 安装VcXsrv4 2 安装桌面环境 xff08 1 xff09 方法1 x
STM32 DMA正常模式等待传输完成和开始下一次传输

选择DMA的正常模式 xff0c 即DMA只传输一次如果当传输完一次后 xff0c 还想再传输一次 xff0c 就需要重启DMA xff1a DMA Cmd DMA1 Channel6 DISABLE 重新设置源地址重新设置目的地址重
增量式编码器和绝对式编码器，ABI信号和UVW信号、编码器PWM信号

一编码器的分类根据检测原理 xff0c 编码器可分为光学式磁式感应式和电容式 xff0c 根据其刻度方法及信号输出形式 xff0c 可分为增量式绝对式以及混合式三种 1 增量式编码器增量式编码器是直接利用光电转换原理输出三组方波
路由器接口管理控制端口辅助端口物理端口逻辑端口局域网

路由器接口管理路由器的接口相对于交换机来说最大的特点就是接口类型和配置更为复杂 xff0c 一般吧路由器上的接口分为三大类 xff1a 1 局域网的LAN接口 xff0c 2 用于广域网接入互联的WAN接口 xff0c 3 应用于LAN
C++各大有名库的介绍

C 43 43 各大有名库的介绍在C 43 43 中 xff0c 库的地位是非常高的 C 43 43 之父 Bjarne Stroustrup先生多次表示了设计库来扩充功能要好过设计更多的语法的言论现实中 xff0c C 43 43 的
树莓派搭建nas服务器的详细过程

前奏默认的登录帐号为 pi xff0c 密码是 raspberry 开启 ssh 在根目录 xff0c 新建一个名为 ssh 的空白文件就行了然后 xff0c 重启就可以ssh访问了命令行下配置 xff1a sudo raspi co
buffer overflow detected错误

最近在写并行程序的时候遇到这个问题在上网查询之后发现好多是由于sprintf的缓冲区不够造成的对比自己程序发现一个很低级的错误 char sc 61 new char 100 sprintf sc 34 d 34 rank string
聊一聊关于ROS开发常用的调试工具(rostopic,rosnode等等)

ROS常用的调试工具有rosnode xff0c rostopic 1 rosnode 参数用法作用listrosnode list查看当前运行了哪些节点inforosnode info node name查看该节点发布接受哪些话题以及服
关于SLAM-Hector建图方法的一些基础点

hector建图算法 1 简介 hector slam不需要里程计数据 xff0c 使用高斯牛顿方法 xff0c 直接使用激光雷达数据估算里程计信息所以 xff0c 只需要激光雷达数据 xff0c 即可完成建图 2 优缺点优点 xff1
查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ）

xfeff xfeff 原文转载于 xff1a http www cnblogs com bluepoint2009 archive 2012 09 18 precision recall f measures html 在信息检索和自然语

查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ）

查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ） 的相关文章

随机推荐

热门标签

查全率（Recall）、查准率（Precision）以及综合评价指标（F1-Measure ）的相关文章