IoU-aware Single-stage Object Detector for Accurate Localization

2023-05-16

Motivation

在这里插入图片描述
从这张图里面可以很好地看出来作者的出发点,即在目标检测里面,分类的分数其实并不能够准确地反应框是否准确, 像上面,都是分类分数高,而iou低的case,而真正iou高的框,分类的分数却没有那么高,而这些框会在做NMS的时候被分高的给干掉.
因此作者提出一种iou_aware的方式来替换这个分数.

那么整个过程就是首先要先预测iou, 然后在测试的时候,对于过nms的分数,用分类和iou来加权的方式,比如

在这里插入图片描述

整个过程,从想法到过程比较自然,有理有据。

值得注意的地方

  1. 在Iou loss这里,作者最终选的是BCE
    在这里插入图片描述
    个人认为这相比于gt是0,1的二分类而言,是soft了一些。或许也可以尝试KL-div

关于loss这里,作者做的对比实验如下

在这里插入图片描述
从表里面可以看出,相比之下, BCE要比L2-loss要好一些.
可能分类比回归更容易学吧.

  1. 作者给了如果用gt-iou来代替predict-iou的话,结果对比如下
    在这里插入图片描述
    会发现当使用gt-iou来做的话,指标要比使用predict-iou 好很多,说明这里面还大有可为.

  2. 为什么Iou-aware会有用, 作者给了一个图
    在这里插入图片描述

图a是原始的RetinaNet的 iou与 det-score的图,会发现这里面有很多分类分低,但是iou挺大的case, 如下
在这里插入图片描述
这说明,其实有很多较为精确的框的,但是因为分低而被杀掉了.

图b,是本文的方法所统计的结果,会发现,高iou, 低score的case少了很多.

在这里插入图片描述
这充分说明了这个方法的有效性.

另外图c,是用gt-iou来看的情况. 对于gt-iou来说,当iou大的时候,基本上和score呈正相关了.在这里插入图片描述

thoughts

iou 作为衡量框准确性的一个重要指标要比单纯的分类分数要可信。尤其是在一些自动标注的任务上,使用Iou作为框精确性的一个衡量,应该是很有用的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

IoU-aware Single-stage Object Detector for Accurate Localization 的相关文章

随机推荐

  • 零代码入门GitHub,图形化交互让你轻松存代码 | 附Git GUI推荐

    鱼羊 发自 凹非寺 量子位 报道 公众号 QbitAI 传说 xff0c 程序员遇到火灾时有三个注意事项 xff1a 真的不能直接跑路吗 Git是目前世界上最流行的分布式版本控制系统 xff0c 用上了它 xff0c 就不必再面对这样的惨剧
  • OBS录课时的参数设置

    OBS Studio是一款功能强大的免费开源软件 xff0c 无广告 录屏只是它的一部分功能 xff0c 对于需要录制屏幕又要录制摄像头的也很适合 xff0c 有不少人将它用于直播 下面介绍我在用OS录制在线课程内容时 xff0c 如何进行
  • MAVLink协议的移植

    mavlink协议被大众知晓应该是PX4项目发起之后 xff0c 随着开源飞控神器PX项目进入国内 本次就只分析移植过程中的问题 xff0c 协议具体内容及其他知识只稍作带过 xff0c 有时间再更新 mavlink的源码有官方的代码生成器
  • python函数变量的用法

    如果想要在一个函数内部来修改外部变量的值 有下面四种方法 a gt 通过返回值赋值 b gt 使用全局变量 c gt 修改list或dict对象的内部元素 d gt 修改类的成员变量 span class token comment ret
  • python常用模块大全

    1 time模块 span class token keyword import span time span class token operator span 一 span class token operator span span
  • 关于自定义比较函数 usort 如何使用 类中的方法

    关于自定义比较函数 usort xff0c 如果直接使用函数 xff0c 是 usort arr 34 yourfunction 34 如果要使用类中的自定义方法 xff0c 则用以下方式 xff1a lt php SortTest 64
  • Python软件编程等级考试四级——20220618

    Python软件编程等级考试四级 20220618 理论单选题判断题 实操第一题第二题第三题 理论 单选题 1 有如下Python程序 xff0c 包含lambda函数 xff0c 运行该程序后 xff0c 输出的结果是 xff1f g s
  • docker启动带xfce桌面和rdp服务的ubuntu

    docker run d p 3389 3389 scottyhardy docker remote desktop 默认用户名ubuntu xff0c 密码ubuntun https hub docker com r scottyhard
  • 10张图带你深入理解Docker容器和镜像

    编者的话 本文用图文并茂的方式介绍了容器 镜像的区别和Docker每个命令后面的技术细节 xff0c 能够很好的帮助读者深入理解Docker 扫VX 领Java资料 xff0c 前端 xff0c 测试 xff0c python等等资料都有
  • 13款Linux安全运维必备的实用工具

    本文介绍几款 Linux 运维比较实用的工具 xff0c 希望对 Linux 运维人员有所帮助 1 查看进程占用带宽情况 Nethogs Nethogs 是一个终端下的网络流量监控工具可以直观的显示每个进程占用的带宽 下载 xff1a ht
  • ros学习(六):geometry_msgs消息类型

    一 geometry msgs Pose 消息类型 http docs ros org en melodic api geometry msgs html msg Pose html http docs ros org en melodic
  • ISO 11519-2与ISO 11898-3之间的关系

    ISO 11519由以下部分组成 xff0c 总称 道路车辆 低速串行数据通信 xff1a Part 1 xff1a General and definitions 概述和定义 Part 2 xff1a Low speed controll
  • 《Autosar从入门到精通-实战篇》总目录_培训教程持续更新中...

    目录 一 Autosar入门篇 xff1a 1 1 DBC专题 xff08 共9篇 xff09 1 2 ARXML专题 xff08 共35篇 xff09 1 2 1 CAN Matrix Arxml xff08 共28篇 xff09 1 2
  • 【MCAL_CANDriver】-1.3-FullCAN和BasicCAN的差异及配置使用

    点击返回 Autosar MCAL高阶配置 总目录 目录 1 什么是FullCAN和BasicCAN 1 1 FullCAN Basic CAN HRH区别 1 2 FullCAN Basic CAN HTH区别 1 3 FullCAN和B
  • ROS学习1

    1 安装ros 我这里使用的是ros melodic这个版本 xff0c 具体安装可以参考其它教程 管理环境 printenv grep ROS 得到 ROS DISTRO 61 melodic ROS ETC DIR 61 opt ros
  • ROS学习1

    1 安装ros 我这里使用的是ros melodic这个版本 xff0c 具体安装可以参考其它教程 管理环境 printenv grep ROS 得到 ROS DISTRO 61 melodic ROS ETC DIR 61 opt ros
  • ubuntu18.04使用apt安装python3.7

    sudo apt update sudo apt install software properties common sudo add apt repository ppa deadsnakes ppa sudo apt install
  • c++读取自定义点云pcd文件

    之前查读取pcd的文件 xff0c 大多数是用python的open3d来进行读取 xff0c 但是这样读取到的信息 xff0c 好像只能够得到 pcd points 和pcd colors 但是如果想要把pcd中的信息都拿到呢 xff0c
  • lio-sam中点云地图保存

    在 src save map srv 中有如下的定义 float32 resolution string destination bool success 注意 下面指的是feedback xff0c 接下来看save map这个服务是如何
  • IoU-aware Single-stage Object Detector for Accurate Localization

    Motivation 从这张图里面可以很好地看出来作者的出发点 xff0c 即在目标检测里面 xff0c 分类的分数其实并不能够准确地反应框是否准确 像上面 xff0c 都是分类分数高 xff0c 而iou低的case 而真正iou高的框