GIoU (Generalized Intersection over Union) 详解

2023-05-16

论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

官方解读:Generalized Intersection over Union (stanford.edu)

一、动机:

        在目标检测任务中,多是采用L1或L2回归损失,回归loss相同的情况下,IoU却可能大不相同。
        如下图(a)所示:三张图有一样的L2距离,但是IoU值却完全不同。坐标表示方法为(x1,y1,x2,y2)。
图(b)为L1距离。坐标表示方法为(x,y,w,h),x,y为中心点坐标。

        IoU有尺度不变性的优点,但是将其作为损失函数,由于某些方面的问题,无法直接使用。

 二、IoU的优点:

  1. IoU作为距离时(比如:LIoU = 1 − IoU ,是一个度量。因为它包含了作为度量的所有属性,比如:非负性,不确定性对称性和三角不等性。
  2. IoU有尺度不变性,这意味着任意两个方框A和B的相似性与他们的空间尺度的无关。

三、IoU同时作为度量和损失函数时,存在两个问题:

  1. 如果两个目标没有重叠,IoU将会为0,并且不会反应两个目标之间的距离,在这种无重叠目标的情况下,如果IoU用作于损失函数,梯度为0,无法优化。
  2. IoU无法区分两个对象之间不同的对齐方式。更确切地讲,不同方向上有相同交叉级别的两个重叠对象的IoU会完全相等。

四、本文的主要贡献:

  1. 将GIoU作为比较任意两个边框的度量。
  2. 使用GIoU作为两个轴对齐矩形的的损失,并提供了解析解。
  3. 把GIoU损失加入到最流行的目标检测算法中(例如:Faster R-CNN,Mask R-CNN和YOLO v3),并且展示了他们在标准目标检测基准中提高的性能。

五、GIoU:

        对于任意的两个A、B框,首先找到一个能够包住它们的最小方框C。然后计算C \ (A ∪ B) 的面积与C的面积的比值,注:C \ (A ∪ B) 的面积为C的面积减去A∪B的面积。再用A、B的IoU值减去这个比值得到GIoU。

 

GIoU作为损失度量时的性能:

 

 

 

IoU和GIoU做为边框损失函数时的算法流程:

 

 

六、实验结果

所有对比实验中(网络:Faster R-CNN,Mask R-CNN and YOLOv3 / 数据集:PASCAL VOC, MS COCO),加过IoU损失和GIoU损失的mAP都在原来的基础得到了提升,在此不一一分析。下图为检测效果图,从左往右分别为LGIoU,LIoU,网络原来的损失函数。实线为ground truth,虚线为预测框。

————————————————
参考:https://blog.csdn.net/weixin_41735859/article/details/89288493

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

GIoU (Generalized Intersection over Union) 详解 的相关文章

  • 这两种关系对于联合运算是否兼容?

    我不确定以下两种关系是否适合联合 R lt schema name B 1 2 2 3 3 And Q lt schema name A B 5 1 6 1 4 2 3 4 我想加入工会 Q U R 可以吗 结果如何 并集运算符要求两个关系
  • 矢量与圆锥的交点

    我有一个向量A定义为 Ao t Ad 我还有一个带有顶点的圆锥体 圆锥尖 V 轴方向D 基半径R和身高H 如何找到向量和圆锥之间的交点 我正在使用 glm 进行数学计算 Here s a simple illustration 我没有处理光
  • C# 最快的 2 组排序值并集

    合并两组排序值的最快方法是什么 速度 big O 在这里很重要 不清楚 假设这已经被执行了数百万次 假设您不知道值的类型或范围 但有一个有效的方法IComparer
  • 无法使用 UNION ALL 创建新表

    SQL执行这段代码 t1和t2具有相同的结构 SELECT FROM t1 UNION ALL SELECT FROM t2 但不是这个 CREATE TABLE test AS SELECT FROM prospects non clie
  • 直线和球体之间的交点

    我试图找到球体和直线之间的交点 但老实说 我不知道该怎么做 有人能帮我解决这个问题吗 将直线表示为函数t x t x0 1 t t x1 y t y0 1 t t y1 z t z0 1 t t z1 When t 0 它将在一个终点 x0
  • 在 C++ 中设置差异

    如果我知道一个集合是另一个集合的子集 并且我想找出差异 那么最有效的方法是什么 前任 伪代码 gt set
  • 从鼠标坐标到 3d 的点-三角形相交?

    我知道如何测试点和三角形之间的交点 但是我不明白 如何使用鼠标坐标将点的起始位置精确地移动到屏幕平面上 因此点角度应该根据鼠标光标在屏幕上的位置而变化 这也应该起作用完美的是 无论我在 OpenGL 应用程序中使用哪个透视角度 因此不同透视
  • 可变数量列表的交集

    我定义两个列表的交集如下 def intersect a b return list set a set b 对于三个参数 它看起来像 def intersect a b c return list set a set b set c 我可
  • Python:使用单词交集而不是字符交集的杰卡德距离

    我没有意识到 Python set 函数实际上将字符串分隔成单个字符 我为Jaccard编写了python函数并使用了python交集方法 我将两个集合传递到此方法中 在将这两个集合传递到我的 jaccard 函数之前 我在设置环上使用 s
  • 测量网格之间的距离

    对于我的项目 我需要测量两个 STL 文件之间的距离 我编写了一个脚本 允许读取文件 将它们相对于彼此放置在所需的位置 现在 在下一步中 我需要检查一个物体到另一个物体的距离 库上是否有可用的函数或脚本允许我执行此过程 因为那时我想要定义诸
  • 多表之间的SQL映射

    这是一个SQL设计问题 首先 设置 我有三张桌子 A 根据对链接服务器的查询自动填充 该表中的数据不能更改 B 只有十几行 包含 As 集合的名称 AtoB 它是映射表 通过它将 As 组织成命名集合 两列上都有外键 例如 A 包含 Gir
  • 数学/算法/ JS:如何确定 2 个以上矩形是否相交,给定每个矩形的 TopLeft(x0, y0) 和 Bottom-Right(x1, y1)

    我遇到了完成我的申请所需的数学问题 所以我寻求帮助 给定 2 个 或更多 但基本上是 2 个 矩形 每个矩形有 2 个已知点 左上角 x1 y1 and 右下角 x2 y2 如果需要解决问题 我可以通过这些信息找到长度 TL x1 y1 T
  • Postgresql UNION 花费的时间是运行单个查询的 10 倍

    我试图获取 postgresql 中两个几乎相同的表之间的差异 我当前运行的查询是 SELECT FROM tableA EXCEPT SELECT FROM tableB and SELECT FROM tableB EXCEPT SEL
  • Rails 3 ActiveRecord:UNION

    有没有办法在 Rails 3 中使用 MySQL UNION 我认为让其工作的唯一方法是直接执行查询 ActiveRecord Base connection execute SELECT REPEAT a 1 UNION SELECT R
  • 查找 SVG 元素在视口中是否可见

    假设我有一些如下所示的 SVG canvas将应用一些变换
  • 使用 PaintComponent 计算两个矩形的交集

    我正在编写一个程序 允许用户将矩形绘制到JLabel 并显示这些矩形的交集和并集 我已经为该类设置了 GUI 但正在努力寻找一种方法来集成矩形类中的交集和并集方法 我知道这些方法在与 GUI 分开使用时是有效的 当我尝试运行该程序时 我不断
  • MYSQL:使用 union 将两个表合并为一个表

    我必须用另外两个表制作一个表 并使用联合 有效的查询是 SELECT FROM tabel1 UNION SELECT FROM tabel2 现在我要做的就是将此结果 数据 放入表3 我已经拥有的表 其列与表1和表2中的列相同 谁能帮我
  • 在联合上分配泛型类型

    TS 中有没有办法通过联合 分布 泛型类型 type Container a value A type Containers a
  • javascript中的地理空间查询[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个 javascript 库 它可以让我进行地理空间查询 我知道 OpenLayers 和
  • UNION ALL mysql 子句中的行默认顺序?..我的意思是,首先提取哪一行?

    例如 如果我有一个真正简单的查询 选择1 联合所有 选择2 然后通过 Perl 或 PHP 获取行 我会将 1 作为第一行 将 2 作为第二行吗 这种行为在任何地方都有描述吗 Thanx 没有默认顺序 无论是在表中还是在查询中 除非您使用

随机推荐

  • Windows柯尼卡打印机驱动安装

    打印机型号 xff1a 柯尼卡 bizhub C300i xff08 打印机机身可见 xff09 1 下载驱动 在柯尼卡驱动官网查找下载打印机驱动 在型号处直接下拉查找自己的型号 xff0c 例如bizhub C300i xff0c 点击搜
  • PyQt开发入门教程

    来源 xff1a PyQt完整入门教程 lovesoo 博客园 cnblogs com 1 GUI开发框架简介 1 1 通用开发框架 electorn xff1a 基于node js xff0c 跨平台 xff0c 开发成本低 xff0c
  • VOC数据集颜色表colormap与代码

    VOC颜色和分类的对于关系 code如下 xff0c 这里提供两个版本 xff0c 一个是list tuple 版本 xff0c 支持直接在opencv的color参数使用 xff1b 另一个是ndarray版返回 list 版 def v
  • 【译】Python3.8官方Logging文档(完整版)

    注 xff1a 文章很长 xff0c 约一万字左右 xff0c 可以先收藏慢慢看哟 01 基础部分 日志是用来的记录程序运行事件的工具 当程序员可以通过添加日志打印的代码来记录程序运行过程中发生的某些事件时 这些事件包含了诸如变量数据在内的
  • OpenCV Scalar value for argument ‘color‘ is not numeric错误处理

    import cv2 cur color 61 np array 128 0 128 astype np uint8 cv2 polylines cvImage ndata isClosed 61 True color 61 cur col
  • COCO格式数据集可视化为框

    使用pycocotools读取和opencv绘制 xff0c 实现COCO格式数据边框显示的可视化 xff0c 可视化前后的示例为 xff1a 代码 xff1a coding utf 8 import os import sys getop
  • 微波遥感(三、SAR图像特征)

    SAR 是主 动式侧视雷达系统 xff0c 且成像几何属于斜距投影类型 因此 SAR 图像与光学图像在成像机理 几何特征 辐射特征等方面都有较大的区别 在进行 SAR 图像处理和应用前 xff0c 需要了解 SAR 图像的基本特征 本文主要
  • 基于Slicing Aided Hyper Inference (SAHI)做小目标检测

    遥感等领域数据大图像检测时 xff0c 直接对大图检测会严重影响精度 xff0c 而通用工具多不能友好支持大图分块检测 Slicing Aided Hyper Inference SAHI 是一个用于辅助大图切片检测预测的包 目前可以良好的
  • YOLOv5训练参数简介

    YOLOv5参数解析 xff0c 这次主要解析源码中train py文件中包含的参数 1 1 39 weights 39 1 2 39 cfg 39 1 3 39 data 39 1 4 39 hyp 39 1 5 39 epochs 39
  • 亚米级土耳其地震影像数据下载

    下载地址1 xff0c 提供震前震后影像 部分震后影像的百度网盘存档 xff1a https pan baidu com s 1 rLV7cR F3casKRwQH7JTw 提取码 xff1a dou3 灾前 灾后影像 下载地址2 xff1
  • nms_rotated编译出错fatal error: THC/THC.h: No such file or directory

    问题描述 xff1a 使用 python setup py develop or 34 pip install v e 34 编译nms rotated时出错 xff1a fatal error THC THC h No such file
  • 解决 AttributeError: module ‘numpy‘ has no attribute ‘int‘

    原因 xff1a numpy int在NumPy 1 20中已弃用 xff0c 在NumPy 1 24中已删除 解决方式 xff1a 将numpy int更改为numpy int xff0c int 方法 xff1a 点击出现错误代码链接会
  • 机载高分辨率SAR数据(~0.1米)

    美国桑迪亚 xff08 sandia xff09 国家实验室提供一系列机载SAR数据 xff0c 包括MiniSAR FARAR等 数据分辨率4英寸 xff0c 约0 1米 原始数据下载地址 xff0c 数据是复数据 xff0c 以不同格式
  • ubuntu18.04 及以上版本命令模式和GUI切换

    网上大多数说的CTRL 43 ALT 43 F1 6进入命令模式 xff0c CTRL 43 ALT 43 F7进入GUI模式 xff0c 在ubuntu18 04 及以上无效 正确的方式是 xff1a 进入命令模式可以通过CTRL 43
  • Python内置库——http.client源码刨析

    看过了http client的文档 xff0c 趁热打铁 xff0c 今天继续研究一下http client的源码 xff08 一 xff09 你会怎么实现 开始之前先让我们回忆一下一个HTTP调用的完整流程 xff1a 看到这张图 xff
  • ssh连接ubuntu访问拒绝(access denied)

    网上大多针对ssh连接ubuntu访问拒绝的解决办法是安装ssh或防火墙开启端口等等 xff0c 但这些都没问题之后还是访问拒绝 xff0c 则考虑ssh包可能安装的有问题 xff0c 可以尝试重装 流程如下 xff1a 1 在ubuntu
  • 【论文-目标检测】RTMDet: An Empirical Study of Designing Real-Time Object Detectors

    论文 代码 官方原理与实现详解 发展YOLO系列并方便支持实例分割和斜框检测等任务 xff0c 亮点 xff1a 设计兼容性backbone和neck xff0c 采用大核深度可分离卷积 xff1b 动态标签分配中采用软标签计算匹配损失 x
  • 【OpenCV】图像金字塔 -- 下采样cv2.pyrDown() , 上采样cv2.pyrUp()

    参考 xff1a cv2 pyrDown TheAILearner 1 cv2 pyrDown 函数cv2 pyrDown 用于实现高斯金字塔中的下采样 函数原型 xff1a dst img 61 cv2 pyrDown src img d
  • 理解depth-wise 卷积

    EfficientNet利用depth wise卷积来减少FLOPs但是计算速度却并没有相应的变快 反而拥有更多FLOPs的RegNet号称推理速度是EfficientNet的5倍 非常好奇 xff0c 这里面发生了什么 xff0c 为什么
  • GIoU (Generalized Intersection over Union) 详解

    论文 xff1a Generalized Intersection over Union A Metric and A Loss for Bounding Box Regression 官方解读 xff1a Generalized Inte