论文阅读:AutoAssign

2023-10-31

1、论文总述

个人感觉本篇论文提出的端到端的动态划分正负样本的work质量是很高的,虽然没有被ECCV录,但是作者已经将这篇论文放在了arxiv上,应该会被其他的顶会收录。
论文提出的背景是:现在目标检测网络中的正负样本的分配都是基于人工先验的,例如anchor-based的根据GT与anchor的IOU进行划分正负样本,以及anchor-free网络中的将GT中心点周围某个半径R之内的点作为正样本,这些都是有极强的先验知识,而且有些超参数,同时也是固定的正负样本:意思就是一旦网络配置和数据集 确定之后,每个anchor或者每个grid cell是不是正负样本就已经确定了,在网络的学习过程中,并不能根据网络的学习效果进行更改(包括ATSS的正负样本分配方式,它也是一种伪动态)
本文提出的大概思路是:GT框里的每个grid cell刚开始都可以认为是正样本/负样本,但会对应 着两个权重w+ 和 w- ,(1)w+(每个grid cell的正样本权重)的产生:不在GT bbox中的w+为0,对bbox GT的中心和bbox中的前景的中心学习一个offset(对那些不能很正常的目标比较有效,如:线状目标,环形目标),然后根据分类得分和定位得分得到confidence,将confidence与刚才产生的center prior进行结合即可产生w+。(2)w-(每个grid cell的负样本的权重)的产生:首先,不在GT bbox中的w-为1,w-的值是根据该点预测的框与GT的iou决定的,IOU越小,则该点的w-越大。

论文中作者提到网络结构是基于FCOS的,所以只给了 w+ 和 w-的产生示意图,没有完整的网络结构
在这里插入图片描述
其中Implict Objectness分支类似于二分类,与classification一起学习,这样看的话是不是有点类似YOLO V3中的正负样本分配?说实话,这篇论文不太好理解,我也是看了好几个小时,而且也没完全搞懂训练和测试的完整流程。。。只能期待着开源了,后续如果对这篇论文有了新的理解的话,我会继续补充。

在这里插入图片描述
上图就是作者想要达到的动态分配正负样本的效果。

In this work, we propose a fully differentiable strategy
for label assignment. As illustrated in Fig. 1, we first follow
the anchor-free manner like FCOS [20] to directly predict
objects on each locations without human-designed anchors.
In order to retain enough locations for further optimizing,
we initially treat all the locations inside a bounding box
as both positive and negative candidates at all scale levels.
Then we generate positive and negative weight maps
to modify the prediction in the training loss. To accommodate the distribution from different categories and domains,
we propose a category-wise weighting module named center weighting to learn the distribution of each category from
data. To get adapted to the appearance and scale of each instance, we propose a confidence weighting module to modify the positive and negative confidences of the locations
in both spatial and scale dimensions. Then we combine
the two modules to generate positive and negative weight
maps for all the locations. The entire process of weighting is differentiable and can be conveniently optimized by
back-propagation.

2、密集预测型FCOS正负样本分配的不足

在COCO、VOC数据集上FCOS、RetinaNet这种正负样本的分配方式对模型的效果影响不那么大,但是到了别的一些困难目标的检测数据集上,可能这种方式就不太好使了。
在这里插入图片描述
在这里插入图片描述

As shown in Fig. 1, existing detectors mainly sample the
positive and negative locations by human prior:
(1) Anchorbased detectors like RetinaNet [11] preset several anchors
of diverse scales and aspect ratios on each location and resort to the Intersection over Union (IoU) for sampling positives and negatives among spatial and scale-level feature
maps.
(2) Anchor-free detectors like FCOS [20] sample a
fixed fraction of center area as spatial positive locations for
each object, and select certain stages of FPN [10] by the
pre-defined scale constraints. These detectors follow the
prior distribution of the objects to design their assignment
strategies, which are proved to be effective on challenging
benchmarks, e.g., Pascal VOC [3, 4] and MS COCO [12].

某个GT应该分配到FPN的哪个层级上,在FCOS和retinanet中这个是人工指定的,而在autoassign中这个也是学出来的。

However, as shown in Fig. 2, in the real world, appearances of
objects vary a lot across categories and scenarios. The fixed center
sampling strategy may pick locations outside objects as positives.
Intuitively, sampling locations on objects is better than the plain
background because these locations are prone to generate higher
classification confi- dences. On the other hand, although CNN can
learn offsets, the obstacle caused by feature shifting when
backgrounds are sampled as positives may decrease the performance.
Thus the fixed strategies above may not always select the most
appropriate locations among spatial and scale dimensions.

3、 Comparison of label assignment between different typical detectors.

在这里插入图片描述

4、we transform the whole assignment step into two weight maps.

在这里插入图片描述

(1)To accommodate to the distributions of different cat
egories, we propose a category-wise and data-dependent
weighting module named center weighting. It starts from
the standard center prior and then learns the distribution of
each category from data.
(2)To get adapted to the appearance and scale of each instance, we further present an instance-wise weighting module called confidence weighting. It dynamically weights the
positions in the spatial and scale dimensions based on the
predicted confidences of each object.
在这里插入图片描述

5、公式

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6、Visualization of learned center weighting weights of different categories

在这里插入图片描述

But when we look into some classes with unique distributions, e.g.,
bear, surfboard and hotdog, the improvements are notable

7、 Analysis of ImpObj for P(cls).

在这里插入图片描述
可以看到ImpObj分支还有很有作用的。

在这里插入图片描述

8、不同数据集上的泛化性

在这里插入图片描述
这点肯定是要提,因为感觉本篇论文的动态分配正负样本是可以根据数据集来学习的,应该是要比以前的固定正负样本分配是要好些的。

参考文献:
1、大白话 《AutoAssign》by Face++

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读:AutoAssign 的相关文章

  • java不通过构造函数创建对象(Unsafe)

    java中不通过构造函数创建对象 也有说不创建对象直接执行成员方法 这里就不和你们扯什么通过 反序列化 clone等方法了 个人觉得都是在胡扯 如何不执行构造函数创建对象 先来带大家认识一个类 sun misc Unsafe 该类主要提供一
  • MySQL入門_テーブル作成

    create database case a show databases drop database case a create database case db use case db drop table if exists user

随机推荐

  • JS之返回字符串最后出现的位置lastIndexOf

    作用 lastIndexOf 方法可返回一个指定的字符串值最后出现的位置 在一个字符串中的指定位置从后向前搜索 语法 stringObject lastIndexOf searchvalue fromindex 参数1 必需 规定需检索的字
  • [ 人力资源面试篇 ] HR 面试题分析详解大集合,看完直怼面试官(一)

    博主介绍 博主介绍 大家好 我是 PowerShell 很高兴认识大家 主攻领域 渗透领域 数据通信 通讯安全 web安全 面试分析 点赞 评论 收藏 养成习惯 一键三连 欢迎关注 一起学习 一起讨论 一起进步 文末有彩蛋 作者水平有限 欢
  • Python面试题

    1 一行代码实现1 100之和 利用sum 函数求和 2 如何在一个函数内部修改全局变量 函数内部global声明 修改全局变量 3 列出5个python标准库 os 提供了不少与操作系统相关联的函数 sys 通常用于命令行参数 re 正则
  • 社区发现:论文中模块度Q的计算

    2 Extending the definition of modularity to directed graphs with overlapping communities 参考文献 1 刘传建 复杂网络中的社团结构划分及分析应用 D
  • glfwPollEvents()程序崩溃

    系列文章目录 文章目录 系列文章目录 前言 一 程序崩溃的地方找不到 二 解决步骤 1 vs2019中打开 诊断工具 窗口 2 在vs2019中打开 并行堆栈 窗口 总结 例子 源码下载 前言 如果使用GLFW 没有这句glfwPollEv
  • dz 2级域名

    例如 http www cheungfei com 开启了二级域名 http bbs cheungfei com 开启之后发现不能同步登陆 刚开始以为要在Ucenter中添加应用 后来发现问题还没有解决 到DISCUZ官网看看别人的帖子 才
  • 多线程、定时器----基础认识篇1

    1 多线程一般通过使用thread的子类或者往thread构造方法中传入runnable对象实现 也就是常说的 继承 thread类 和 实现runnable接口 注 实现runnable接口可以实现线程 原理是 在thread的run方法
  • Instagram Shop如何开通?如何销售?最全面攻略

    借助 Instagram 商店 品牌可以策划一系列可购物的商品 这些商品可通过其 Instagram 个人资料直接访问 这使得在应用程序上销售更容易 也被潜在客户发现 一 什么是Instagram Shop Instagram 商店为商家提
  • 2021 年山东省职业院校技能大赛中职组“网络安全” 赛项

    2021 年山东省职业院校技能大赛 中职组 网络安全 赛项 竞赛题库 网络安全赛项专家组 2021 年 11 月 赛题说明 一 竞赛时间安排与分值权重 二 竞赛拓扑图 模块编号 模块名称 竞赛时间 小时 权值 A 基础设施设置与安全加固 3
  • php 操作 MySQL 中的Blob类型

    我们需要保存一个文件或者一张图片或者其他二进制或多媒体文件时 经常选择使用 类型 一 基本使用 Blob就是一种Mysql的数据类型 它是一个二进制大型对象 可以作为大量数据的容器 其实更准确地说Blob是一系列数据类型 MySQL的四种B
  • 深入源码分析Spring为什么不支持构造方法的循环依赖

    我们知道当通过构造方法的方式注入属性时 是不支持循环依赖这种场景的 本文主要通过分析源码看看为什么构造方法不能支持循环依赖 当然 如果读者还不了解循环依赖的问题 建议先结合源码搞清楚 可以先看看这篇文章 深入源码分析Spring如何解决循环
  • 高通LK代码devinfo分区 read_device_info

    有一个devinfo分区专门用来保存一些信息 在devinfo分区没烧录过的情况下 默认Charger screen enabled false 没有关机充电动画 fastboot oem device info lk调用读这些信息 当然不
  • 宝塔搭建网站教程php,怎么利用宝塔面板搭建网站详细教程

    利用宝塔面板搭建网站是当前主流形式 宝塔面板操作简单 可视化操作 是新手和老司机搭建网站的首选 今天我的主题网就给小白们分享下怎么利用宝塔搭建自己的网站 如果你还没有安装宝塔可以参考 宝塔面板安装小白教程 来进行安装 1 宝塔面板添加站点步
  • 【满分】【华为OD机试真题2023B卷 JAVA&JS】经典屏保

    华为OD2023 B卷 机试题库全覆盖 刷题指南点这里 经典屏保 知识点循环迭代编程基础 时间限制 1s 空间限制 256MB 限定语言 不限 题目描述 DVD机在视频输出时 为了保护电视显像管 在待机状态会显示 屏保动画 如下图所示 DV
  • JS的一些数据类型的转换

    bytes 转 16进制字符串 function bytesToHex bytes for var hex i 0 i lt bytes length i hex push bytes i gt gt gt 4 toString 16 he
  • 入行网络工程师一年的心得体会

    本人与2019年毕业与天津某高校的网络工程专业 大学期间就考了一个网络工程师的软考中级职称 过了一个没啥用的英语四级 也有想过考一个华为或者思科的IE证书 但是价格对于一个学生党来说 确实代价太大了 报一个培训班1w5 考试费用零零散散加起
  • RabbitMQ入门教程(安装,管理插件,Publisher/Consumer/交换机/路由/队列/绑定关系,及如何保证100%投递等)

    RabbitMQ入门教程 安装 管理插件 Publisher Consumer 交换机 路由 队列 绑定关系 及如何保证100 投递等 1 RabbitMQ简介及AMQP协议 开源的消息代理和队列服务器 基于AMQP Advanced Me
  • IDEA 无法找到jdk,只能找到jre解决方式(亲测有效)

    在第一次使用IDEA的时候 发现需要自己去配置SDK的路径 但发现死活找不到jdk 只能找到jre 搜索资料发现可能是只装了jre 没有装jdk 在配置SDK前先要配置Java的核心 JDK 其实JDK就是SDK 只不过SDK的配置依赖着J
  • asp.net core identity学习1

    ASP NET Identity 学习 创建一个Asp net core mvc项目 添加Nuget包 Microsoft EntityFrameworkCore SqlServer 3 1 3 Microsoft EntityFramew
  • 论文阅读:AutoAssign

    文章目录 1 论文总述 2 密集预测型FCOS正负样本分配的不足 3 Comparison of label assignment between different typical detectors 4 we transform the