YOLOX论文解读

2023-10-27


论文: 《YOLOX: Exceeding YOLO Series in 2021》
代码: https://github.com/Megvii-BaseDetection/YOLOX

创新点

  1. 将YOLO检测器变为anchor-free形式,减少人工设置参数;
  2. 集成了其他先进检测技术(比如decoupled head、label assignment策略SimOTA)取得了SOTA性能;

与YOLO-Nano相比,AP提升1.8%;与YOLOv3相比,性能提升3%;
YOLOX-L,与YOLOv4和v5有相当参数量,在COCO数据集上达到50AP,在V100平台上达到68.9FPS;

算法

Decoupled head

为了解决分类分支与回归分支冲突问题,解耦两分支;
解耦头的作用如下:
1、加快拟合;
2、对end-to-end yolo(指无NMS后处理过程)性能影响比较大;如表1
在这里插入图片描述
具体解耦操作如下:如图2
1、使用 1 ∗ 1 1*1 11卷积降维到256;
2、增加两个并行分支,每个分支(分类、回归)使用两个3*3卷积;
3、在回归分支额外增加iou分支;
在这里插入图片描述

Strong data augmentation

数据增强主要采用Mosaic 和 MixUp;
mixup检测与分类原理相似;
1、对于尺度不一的输入,通过补0对齐,尺寸使得可以容纳下两张图;
2、相应的loss权重变为mixup参数lambd;

Anchor-free

Anchor-free可以减少设计的参数量及涉及的许多技巧(anchor聚类、Grid Sensitive)

Multi positives

为了与yolov3一致,anchor-free方案中也仅选择一个正样本(gt中心位置),同时忽略其他高质量预测框;
但是由于有些正样本也有正向作用,同时改善正负样本不均衡,因此作者将中心3*3区域作为正样本; 实验结果如表2,AP达到45,超越最好的YOLOv3基线44.3;
在这里插入图片描述

SimOTA

SimOTA过程如下:
1、计算成对预测框与真值框代价,如式1;
在这里插入图片描述
2、计算真值框与前k个预测框iou,其和为Dynamic k;因此对于不同真值框,其Dynamic k存在差异。
3、最后选择代价最小的前Dynamic k个预测框作为正样本;
SimOTA使得AP从45%提升至47.3%;相对于YOLOv3上,性能提升3%,见表2;

End-to-end YOLO

作者跟随参考文献39,增加两个卷积层,一对一分配标签,停止梯度回传,但是性能及推理速度出现下降,如表2。

实验结果

在这里插入图片描述

结论

作何提出一种高性能anchor-free检测器YOLOX,其在性能及速度上达到比较好的平衡;

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

YOLOX论文解读 的相关文章

随机推荐

  • Python3 ThreadPoolExecutor--线程池

    1 线程池创建 def init self max workers None thread name prefix initializer None initargs max workers 设置线程池中最多能同时运行的线程数目 threa
  • mysql-跨库联合查询

    目前微服务很火 但是就存在问题 服务拆分 数据库也进行拆分 mysql如果A数据库数据需要联合查询B数据库 应该如何实现呢 sqlserver 可以使用dblink 具体不做说明 查资料即可 着重讲解mysql 1 同实例不同库 1 gt
  • 【数字图像处理】四.MFC对话框绘制灰度直方图

    本文主要讲述基于VC 6 0 MFC图像处理的应用知识 主要结合自己大三所学课程 数字图像处理 及课件进行回忆讲解 主要通过MFC单文档视图实现点击弹出对话框绘制BMP图片的灰度直方图 再获取平均灰度 中指灰度和标准差等值 文章比较详细基础
  • slowfast解读:facebook用于机器视觉分析视频理解的双模CNNk

    检测并归类图像中的物体是最广为人知的一个计算机视觉任务 随着ImageNet数据集挑战而更加流行 不过还有一个令人恼火的问题有待解决 视频理解 视频理解指的是对视频片段进行分析并进行解读 虽然有一些最新的进展 现代算法还远远达不到人类的理解
  • Android读取联系人数据库

    联系人表详解 contacts content com android contacts contacts ContactsContract Contacts CONTENT URI 附注 用户的联系人表 每个联系人占一行 不包括用户已经删
  • mongodb用户权限管理-001

    创建自定义用户 1 添加用于全局管理的角色 db createUser user root pwd password roles role root db admin 2 添加管理某一数据库的角色 可以根据需要为其添加权限 也可以之后根据需
  • JavaWeb基础3——Maven基础&MyBatis

    导航 黑马Java笔记 踩坑汇总 JavaSE JavaWeb SSM SpringBoot 瑞吉外卖 SpringCloud SpringCloudAlibaba 黑马旅游 谷粒商城 Maven高级 Maven高级 java relati
  • Kubernetes Pod详解

    一 Pod介绍 1 Pod的结构 每个Pod中都可以包含一个或者多个容器 这些容器可以分为两类 用户程序所在的容器 数量可多可少 Pause容器 这是每个Pod都会有的一个根容器 他的作用有两个 1 可以以他为依据 评估整个Pod的健康状态
  • esp8266 12e 光控控制板载LED灯

    注意 本篇这里是使用了2个光敏电阻 D2口检测到光暗时才会执行D5的检测 要两个同时检测到黑暗才能点亮LED灯 检测到天黑时led就会快闪 天亮时慢闪 2 两个光敏代码 int LED LED BUILTIN 定义esp8266内置的led
  • 从云1.0时代到云2.0时代

    本文节选自 大话存储2 一书中第20章 转载请注明出处及作者 冬瓜头 20 8 4 云基础架构的 艺术与哲学意境 另外 我发挥了一下想象力 将云想象成为一部精密机械 并画了一张图 如图20 40所示 希望通过这张图能够让大家更加深刻的认识云
  • kubernetes四层负载均衡 —— service(二)

    目录 四 Kubernetes蓝绿部署 金丝雀发布 1 概述 2 金丝雀发布过程 3 蓝绿发布 五 Service代理 kube proxy组件详解 1 kube proxy组件介绍 2 kube proxy工作模式 四 Kubernete
  • uniapp-select 下拉框

    目前uniapp下拉框中比较友好的 功能比较完善 链接 superwei combox 组合框 DCloud 插件市场下拉搜索选择组合框 基于官方uni combox组件 解决选择后再次选择不展示全部选项的问题 支持模糊搜索和JSON数组格
  • mysql SQL语法

    增删改查 增 insert into table col1 clo2 col3 values str1 str2 str3 str1 str2 str3 删 delete form table where Expression 改 upda
  • kaggle竞赛——数据处理

    kaggle竞赛攻略 数据处理 数据导入 Datatable time import datatable as dt df dt fread data train csv print Train size data shape Train
  • (转)JS实现可编辑的表格

    来自网络 这个不错 就转了收藏 http apps hi baidu com share detail 30648462 html
  • MATLAB如何生成独立的随机数

    随机数流 随机数流是由确定性算法生成的一个伪随机数序列的源 伪随机序列是随机数理论序列的逼近 其分布满足独立同分布 i i d 条件 但实际上 确定性算法无法生成 i i d 序列 算法生成的序列可通过分布和相关性的统计检验 表明它们是很好
  • windows 安装metis_Win10 VS2013 suitesparse-metis-for-windows 1.3.1

    suitesparse metis for windows 1 3 1 安装包内附SuiteSparse 4 5 1 Metis 5 1 0和 lapack 3 4 1 Github上面由整理好的suitesparse包适合在Windows
  • react 拖拽组件 react-sortable-hoc的使用

    react 拖拽组件 react sortable hoc 使用react sortable hoc实现拖拽 如图 提示 下面案例可供参考 1 文件1 代码如下 示例 文件名称 dragcomponents import as React
  • 【esp32-s3】7.2 I2S——播放wav文件

    文章目录 1 前言 2 硬件 3 代码 4 结果 1 前言 本章实现了播放和录制功能 2 硬件 3 代码 I2S Digital Microphone Recording Example This example code is in th
  • YOLOX论文解读

    文章目录 创新点 算法 Decoupled head Strong data augmentation Anchor free Multi positives SimOTA End to end YOLO 实验结果 结论 论文 YOLOX