【计算机视觉

2023-10-27

一、Precision、Recall 和 F1-score

在图像目标检测中,常用的评估指标包括以下几项:

  1. 精确率(Precision):也称为查准率,表示被分类为正类别的样本中真正为正类别的比例。计算公式为:Precision = TP / (TP + FP),其中TP是真正例(模型正确预测为正类别的样本数),FP是假正例(模型错误预测为正类别的样本数)。
  2. 召回率(Recall):也称为查全率,表示真正为正类别的样本中被正确分类为正类别的比例。计算公式为:Recall = TP / (TP + FN),其中TP是真正例,FN是假反例(模型错误预测为负类别的样本数)。
  3. F1值(F1-score):综合考虑了精确率和召回率,是二者的调和平均值。计算公式为:F1 = 2 * (Precision * Recall) / (Precision + Recall)。

二、IoU

IoU(Intersection over Union)是图像目标检测中常用的评估指标之一,用于衡量检测框的准确程度。它通过计算检测框与真实框之间的交集与并集之比来评估两者的重叠程度。

IoU的计算方法如下:

  1. 首先,确定两个框的坐标表示方式,一般使用矩形框的左上角和右下角坐标表示。
  2. 计算两个框的相交部分的面积,即交集面积。交集面积可以通过计算两个框的重叠部分的宽度和高度,并相乘得到。
  3. 计算两个框的并集面积,即将两个框的面积相加,然后减去交集面积。
  4. 最后,将交集面积除以并集面积,得到IoU的值。计算公式为:IoU = 交集面积 / 并集面积。

IoU的取值范围在0到1之间,数值越接近1表示两个框的重叠程度越高,数值越接近0表示两个框的重叠程度越低或没有重叠。

在目标检测中,通常会设定一个IoU阈值作为判断检测结果是否正确的标准。常见的IoU阈值为0.5或0.75,即当IoU大于等于阈值时,认为检测结果正确。根据不同任务和需求,可以调整IoU阈值来平衡准确性和召回率之间的权衡。

IoU在目标检测中被广泛应用,用于评估算法的性能,进行非极大值抑制(NMS)处理以消除重复检测框,并用于训练损失函数的计算等。

三、mAP

mAP(mean Average Precision)是目标检测任务中常用的综合评估指标,用于衡量模型在多个类别上的性能。

首先,针对每个类别,计算出该类别的精确率-召回率曲线(PR曲线)。PR曲线是通过改变置信度阈值,计算不同召回率下的精确率得到的。在计算PR曲线时,需要根据模型的预测结果和真实标签,计算出不同置信度阈值下的精确率和召回率。

然后,根据PR曲线计算该类别的平均精确率(AP)。AP是通过对PR曲线下的面积进行积分计算得到的,表示模型在该类别上的平均精确率。AP的取值范围在0到1之间,数值越高表示模型在该类别上的性能越好。

最后,对所有类别的AP进行平均,得到mAP。mAP是所有类别AP的平均值,用于综合评估模型在多个类别上的性能。

需要注意的是,计算AP和mAP时通常会使用特定的IoU阈值(如0.5或0.75)来判断检测结果的正确性,即只有当检测框与真实框的IoU大于等于阈值时,才认为该检测结果是正确的。

mAP是目标检测中最常用的评估指标之一,能够综合考虑模型在不同类别上的精确率和召回率。它对模型在整个数据集上的性能进行了整体评估,提供了更全面和准确的性能指标。

四、AP

4.1 定义

AP(Average Precision)是目标检测领域中常用的评估指标之一,用于衡量检测算法在不同类别上的性能。AP的计算方法基于精确率-召回率曲线(PR曲线)。

首先,针对每个类别,根据模型的预测结果和真实标签,计算不同置信度阈值下的精确率和召回率。然后,根据这些精确率-召回率数据绘制出PR曲线。

在PR曲线上,以不同召回率的数值为横坐标,相应的精确率为纵坐标,可以得到一条曲线。AP的计算方法是对该曲线下的面积进行积分,即计算PR曲线与纵轴之间的面积。

为了更全面地评估模型的性能,一般会计算多个置信度阈值下的AP,并对这些AP进行求平均,得到mAP(mean Average Precision)。mAP是目标检测中最常用的综合评估指标之一,可以同时考虑模型在不同类别上的精确率和召回率。

AP和mAP的取值范围都是0到1之间,数值越高表示性能越好。当AP或mAP达到1时,表示模型在所有类别上都实现了完美的精确率和召回率。

需要注意的是,计算AP和mAP时通常会使用特定的IoU阈值(如0.5或0.75)来判断检测结果的正确性,即只有当检测框与真实框的IoU大于等于阈值时,才认为该检测结果是正确的。

4.2 分类

4.2.1 APs

APs(Average Precision at different scales)是一种平均精确率(Average Precision)的计算方法,用于评估目标检测算法在不同尺度下的性能。

在目标检测任务中,目标物体的尺度可能会发生变化,比如物体在远处较小,在近处较大。传统的平均精确率(AP)计算方法假定目标物体在所有尺度下都具有相同的重要性,忽略了尺度变化对检测性能的影响。为了更准确地评估模型在不同尺度下的检测性能,引入了APs的概念。

APs的计算方法基于目标框的尺度信息。具体步骤如下:

  1. 针对每个类别,将所有目标框按照其尺度进行分组,例如可以根据目标框的面积进行分组。
  2. 对于每个尺度组,计算该组中目标框的精确率-召回率曲线(PR曲线)。这里的精确率和召回率的计算方式与传统的AP计算方法相同。
  3. 在每个尺度组中,计算该组的平均精确率(AP)。即对该组的PR曲线下的面积进行积分得到AP值。
  4. 最后,对所有尺度组的AP进行平均,得到APs。APs表示模型在不同尺度下的平均精确率。

通过使用APs来评估目标检测算法,可以更准确地考虑尺度变化对性能的影响。它提供了在不同尺度下的性能指标,使得模型的性能评估更全面和准确。这对于需要处理多尺度目标的应用场景具有重要意义。

4.2.2 APr

APr(Average Precision at different recalls)是一种平均精确率(Average Precision)的计算方法,用于评估目标检测算法在不同召回率下的性能。

在目标检测任务中,不同的应用场景可能对召回率有不同的要求。例如,在某些场景下,需要尽量找出所有的目标物体,因此更注重高召回率。传统的平均精确率(AP)计算方法将所有召回率下的精确率平均,没有考虑不同召回率对检测性能的影响。为了更准确地评估模型在不同召回率下的性能,引入了APr的概念。

APr的计算方法基于目标框的召回率信息。具体步骤如下:

  1. 针对每个类别,将所有目标框按照其召回率进行分组,例如可以根据目标框的召回率进行分组。
  2. 对于每个召回率组,计算该组中目标框的精确率-召回率曲线(PR曲线)。这里的精确率和召回率的计算方式与传统的AP计算方法相同。
  3. 在每个召回率组中,计算该组的平均精确率(AP)。即对该组的PR曲线下的面积进行积分得到AP值。
  4. 最后,对所有召回率组的AP进行平均,得到APr。APr表示模型在不同召回率下的平均精确率。

通过使用APr来评估目标检测算法,可以更准确地考虑召回率的变化对性能的影响。它提供了在不同召回率下的性能指标,使得模型的性能评估更全面和准确。这对于在不同应用场景中需要平衡精确率和召回率的目标检测任务具有重要意义。

4.2.3 两者之间的区别

APs和APr是两种不同的平均精确率(Average Precision)计算方法,用于评估目标检测算法在不同类别上的性能。

APs(Average Precision at different scales)是一种基于目标尺度变化的平均精确率计算方法。在目标检测任务中,目标物体的尺度可能会发生变化,比如物体在远处较小,在近处较大。为了考虑这种尺度变化对检测性能的影响,APs将不同尺度下的检测结果分别计算精确率,然后求取平均值。这样可以更全面地评估模型在不同尺度下的检测性能。

APr(Average Precision at different recalls)是一种基于召回率变化的平均精确率计算方法。在目标检测任务中,不同的应用场景可能对召回率有不同的要求。例如,在某些场景下,高召回率可能更为重要,需要尽量找出所有的目标物体。为了评估模型在不同召回率下的性能,APr通过设定不同的召回率阈值,计算对应的精确率,然后求取平均值。

综上所述,APs关注目标尺度变化对检测性能的影响,而APr关注召回率变化对检测性能的影响。这两种方法在某些特定场景下能够更全面地评估目标检测算法的性能。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉 的相关文章

  • opencv畸变校正的两种方法

    opencv中畸变校正有两种方法 1 undistort 直接进行畸变校正 void cv undistort InputArray src 原始图像 OutputArray dst 矫正图像 InputArray cameraMatrix
  • python人脸识别(转载)

    源码出处 http www cnblogs com AdaminXie 该项目笔记是基于下面博客的摘抄 Python 3 利用 Dlib 实现摄像头实时人脸识别 coneypo 博客园 cnblogs com Python 3 利用 Dli
  • 图像特征提取技术

    目 录 前 言 基于颜色的特征提取 1 颜色空间 2 直方图以及特征提取 基于纹理的特征提取 1 灰度共生矩阵 2 tamura纹理 基于深度神经网络的图像处理 前 言 图像特征提取属于图像分析的范畴 是数字图像处理的高级阶段 本文将从理论
  • 如何在linux系统下创建空白文本.txt文件

    如何在linux系统下创建空白文本 txt文件 跳转到要新建文本的目录下 打开终端 输入命令 最后 跳转到要新建文本的目录下 可利用cd命令在终端跳转 或者直接到要新建文件的目录文件夹中 打开终端 输入命令 touch 文本名 txt 例如
  • 项目设计:基于YOLO目标检测算法的安全帽/口罩/汽车/行人/交通标志...检测

    本文将详细介绍YOLO目标检测算法 该算法支持各种目标检测 包括 安全帽 汽车 造价 交通标志 等 其他毕业设计题目推荐参考 毕业设计 电子 通信 计算机 物联网专业毕业设计选题参考 嵌入式linux 单片机STM32 web 图像 htt
  • 卷积核的基本概况

    一 什么是卷积核 在数学上 卷积核的标准定义是 两个函数在反转和移位后的乘积的积分 其中 函数g一般称为 过滤器 filters 函数f指的是 信号 图像 在卷积神经网络里 卷积核其实就是一个过滤器 但在深度学习里 它不做反转 而是直接 执
  • 目标检测算法改进系列之添加SCConv空间和通道重构卷积

    SCConv 空间和通道重构卷积 SCConv 空间和通道重构卷积 的高效卷积模块 以减少卷积神经网络 CNN 中的空间和通道冗余 SCConv旨在通过优化特征提取过程 减少计算资源消耗并提高网络性能 该模块包括两个单元 1 空间重构单元
  • 目标检测中的损失函数:IOU_Loss、GIOU_Loss、DIOU_Loss和CIOU_Loss

    文章目录 前言 1 IOU Loss Intersection over Union Loss 2 GIOU Loss Generalized Intersection over Union Loss 3 DIOU Loss Distanc
  • OpenCV 笔记(9):常用的边缘检测算子—— Roberts、Prewitt、Sobel

    在本文开始之前 我们先了解一下算子的概念 算子 英语是 Operator 它是一个函数空间到函数空间上的映射 O X X 广义上的算子可以推广到任何空间 函数 是从数到数的映射 泛函 是从函数到数的映射 算子 是从函数到函数的映射 算子不等
  • 机器学习的12个基础问题

    1 阐述批归一化的意义 算法 1 批归一化变换 在一个 mini batch 上应用于激活 x 批归一化是一种用于训练神经网络模型的有效方法 这种方法的目标是对特征进行归一化处理 使每层网络的输出都经过激活 得到标准差为 1 的零均值状态
  • 推荐几个计算机视觉与自动驾驶相关的平台!

    今年来 各家自动驾驶与AI公司开始规模化量产 可落地的技术成为大家争先占领的重点 然而这个行业对从业者能力要求较高 内部非常卷 一个岗位难求 如何从内卷中脱颖而出 除了极强的自律外 系统的学习方法也很重要 这里给大家推荐了几个国内非常具有影
  • 软件测试/人工智能丨常见的计算机视觉的业务场景有哪些?计算原理和测试指标

    计算机视觉在各种业务场景中都有广泛的应用 以下是一些常见的计算机视觉的业务场景 以及与之相关的计算原理和测试指标 图像识别和分类 业务场景 识别图像中的对象 场景或模式 如物体识别 人脸识别 计算原理 使用卷积神经网络 CNN 等深度学习模
  • 目标检测YOLO实战应用案例100讲-自动驾驶复杂场景下目标检测(续)

    目录 3 2 YOLOv5框架的分析 3 3改进算法的基本思想 3 4改进聚类算法 3 5重构损失函数模型和NMS算法 lt
  • 智能机器人:未来与现实的交汇

    导言 人工智能智能机器人是当今科技领域的璀璨明珠 将技术 感知和智能相结合 呈现出前所未有的发展态势 人工智能助力的智能机器人代表了科技融合的巅峰 其强大的感知 学习和决策能力正深刻改变着我们的生活 本文将深入探讨人工智能智能机器人的定义
  • 目标检测深度学习的anchor

    在目标检测深度学习中 Anchor是一种预定义的框 用于在图像中采样不同位置 尺度和长宽比例的区域 作为目标检测模型的候选区域 Anchor是Faster R CNN等基于Anchor的目标检测算法的核心概念 具体来说 Anchor有以下几
  • 图像相关知识点及属性介绍

    图像常用属性指标 图像的常用属性指标有以下几个 分辨率 分辨率是指图像中可以显示的水平和垂直像素数 较高的分辨率意味着图像具有更多的细节和更高的清晰度 常用单位有像素 px 或者万像素 MP 色彩深度 色彩深度是指图像中每个像素可以表示的不
  • 详解数据科学自动化与机器学习自动化

    过去十年里 人工智能 AI 构建自动化发展迅速并取得了多项成就 在关于AI未来的讨论中 您可能会经常听到人们交替使用数据科学自动化与机器学习自动化这两个术语 事实上 这些术语有着不同的定义 如今的自动化机器学习 即 AutoML 特指模型构
  • 友思特分享 | CamSim相机模拟器:极大加速图像处理开发与验证过程

    来源 友思特 机器视觉与光电 友思特分享 CamSim相机模拟器 极大加速图像处理开发与验证过程 原文链接 https mp weixin qq com s IED7Y6R8WE4HmnTiRY8lvg 欢迎关注虹科 为您提供最新资讯 随着
  • 基于opencv的大米计数统计(详细处理流程+代码)

    在我每周的标准作业清单中 有一项是编写计算机视觉算法来计算该图像中米粒的数量 因此 当我的一个好朋友M给我发了一张纸上的扁豆照片 显然是受到上述转发的启发 请我帮他数一下谷物的数量时 它勾起了我怀旧的回忆 因此 我在我的旧硬盘上寻找很久以前
  • 回望计算机视觉会议ICCV的31年

    作者 原野寻踪 编辑 汽车人 原文链接 https zhuanlan zhihu com p 670393313 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 全栈算法 技术交流群 本文只做

随机推荐

  • [1151]python连接 redis cluster集群

    使用pip search查看可安装的Redis模块版本 PS D code gt pip install pip search 安装pip search模块 PS D code gt pip search redis 利用pip searc
  • 从DEMO到完成项目过程的流程

    一 项目评审 认真看demo需求是关键 根据项目demo原型 将项目功能点细分 按每个功能点实现的大致期限 去估计整个项目的期限 一旦项目评估预期确定 需要严格按照预期来实现 决不能拖拉 二 项目实施中 项目实施中 尽量以实现demo功能为
  • QQ机器人相关指令实现-对接小夹子

    代码地址以及视频地址 代码地址 视频地址 实现小夹子网的对接 打开小夹子网了解如何对接 小夹子网 小夹子API对接文档 完成认证的功能 通过小夹子网编写相关常量信息 public interface ClipWebConstants 基础路
  • 判断链表有环并返回入环的第一个节点

    这个问题可以两部分组成 1 首席判读链表是否有环 2 有环的话 在公共点拆开 设在ptr1 ptr2 那么ptr2前进一步 ptr2 ptr2 gt next ptr1拆链表 ptr1 gt next NULL 此时 就有两个链表了 一个是
  • 9008小米售后权限账号_小米救砖教程

    今早在头条看到个微头条 大概意思是小米9有锁机只需要几百块 然后就有人在下边评论说 为什么要出这期解锁教程呢 是因为某些沙雕说小米9进9008刷机不需要售后权限 当然并没有在上图出现 我当场笑喷 首先普及一下 mi8及以上用9008刷机需要
  • Camera根据鼠标操作观察物体(移动,转动,滑动)

    领导安排了一个任务 客户需求根据鼠标操作可以更详细的观察物体 于是开始研究Camera的使用 客户要求 1 按住右键可以旋转观察物体 2 按住左键可以平移的上下拖动视角 3 滚动滑轮可以拉近距离 思路 需要移动的是摄像机而不是物体 因为物体
  • 猜数字游戏

    define CRT SECURE NO WARNINGS 1 include
  • 在 Spring 中 Mock RestTemplate

    如果我们程序中使用了 RestTemplate 进行 HTTP API 调用 通常在编写单元测试时 为了让测试可控 会将 RestTemlate 调用进行 mock 而不是进行真实的 HTTP API 调用 这里 我们将介绍两种 mock
  • 【华为OD机试 2023】 打印机队列(C++ Java JavaScript Python)

    华为od机试题库 华为OD机试2022 2023 C Java JS Py https blog csdn net banxia frontend category 12225173 html 华为OD机试2023最新题库 更新中 C Ja
  • 【模板】高精度除低精度

    文章目录 1 数组 2 vector 推荐 1 数组 include
  • blender中的灯光和相机学习笔记

    目录 环境光 灯光属性 比如高反 编辑灯光基础 灯光基本属性 EV渲染器 点光 日光 面光 自发光 环境光 在渲染视图中 没有任何光时 物体只受环境光的影响 灯光属性 比如高反 在视图层属性中设置 灯光基础 1 四种灯光 点光 日光 聚光
  • 计算机视觉学习总结:基本的图像操作和处理(二)

    Numpy NumPy http www scipy org NumPy 是非常有名的 Python 科学计算工具包 其中 包含了大量有用的思想 比如数组对象 用来表示向量 矩阵 图像等 以及线性代数函数 1 图像数组表示 from PIL
  • 随想录(程序员的缺点)

    The original address of the document http blog csdn net feixiaoxing article details 7555315 声明 版权所有 欢迎转载 请勿用于商业用途 联系信箱 f
  • nvcc 编译并行程序时报错gcc: error trying to exec ‘cc1plus‘: execvp: 没有那个文件或目录

    一 nvcc 编译程序时报错 gcc error trying to exec cc1plus execvp 没有那个文件或目录 cc1plus 是gcc编译工具链中用到的一个程序 报错非常直白 就是说gcc在执行时找不到这个程序 二 问题
  • 北京航空航天计算机考研科目,2020考研北京航空航天大学计算机考研考试科目...

    2020考研 名校一直是考研学子的首选 北京航空航天大学作为全国名校 也是深受考研学子热衷追捧 那么下面启航小编就来介绍一下 2020考研 北京航空航天大学计算机考研科目 的相关内容 供考研学子参考 一起来了解一下吧 1 北京航空航天大学计
  • vue-admin 详细注释,必须手把手做项目系列之(二)

    文章将会自动保存至草稿 更新 麻雀虽小五脏俱全 项目地址 https github com whylisa vue admin step by step git 前言 这两天项目上线楼主要一大推的事要忙 要和产品撕逼 要和后台讨论一系列的问
  • selenium面试题

    今天有同学问到seleinum面试的时候会问到的问题 随便想了想 暂时纪录一下 欢迎大家在评论中提供更多问题 回复是我自己的答案 如果大家有什么好的看法 可以留言交流 去哪儿的面试题 selenium中如何判断元素是否存在 selenium
  • 【C++】 探索程序 详细解读程序在运行过程中都发生了什么

    目录 头文件 源代码 头文件重复包含 问题 解决方案 程序生成过程 预处理Preprocessi 编译Compilation 汇编Assembly 链接Linking 编译期 运行期 编译期确定 运行期确定 编译期错误 运行期错误 类和对象
  • 解决某些软件无法在parallels desktop虚拟机下运行

    步骤1 打开注册表 点开始菜单 点运行 输入regedit exe后回车 步骤2 找到HKEY LOCAL MACHINE HARDWARE DESCRIPTION System 步骤3 找到右边的VideoBiosVersion 双击打开
  • 【计算机视觉

    文章目录 一 Precision Recall 和 F1 score 二 IoU 三 mAP 四 AP 4 1 定义 4 2 分类 4 2 1 APs 4 2 2 APr 4 2 3 两者之间的区别 一 Precision Recall 和