dn-detr:通过去噪任务加速detr训练

2023-10-31

dn-detr:通过去噪任务加速detr训练

在这里插入图片描述

论文链接:https://arxiv.org/abs/2203.01305
dn-detr训练速度

自DETR问世以来,transformer被引入到了目标检测领域,DETR通过引入query和bipartite graph matching 机制,两两匹配GT和PRED,实现对NMS的摒弃,可以做到真正的end to end。然而DETR存在着训练过慢、训练显存占用大和对小目标物体识别效果差的问题。针对DETR的缺点,已有不少的工作开展了讨论和研究,如Deformable DETR、Conditional DETR、Anchor DETR、DAB-DETR等。大多数工作致力于解耦Query,如将Query解释为 content part 和 anchor或reference point的组合,并没有人从bipartite graph matching机制入手。这篇论文提出DETR训练过慢的原因在于训练初期bipartite graph matching无法稳定的匹配GT和PRED,导致早期训练阶段的优化目标不一致难以收敛。这篇论文通过引入GT的去噪任务来帮助稳定训练初始的bipartite graph matching,加快bipartite graph matching的收敛。

在这里插入图片描述

观察训练初期,GT每次匹配的Pred不相同,需要多个回合才能稳定下来
DN-DETR在DAB-DETR的基础上实现,将query视为label embeddeding和anchor的组合,在训练过程中,除了原有的query外,decoder输入M组增加噪声的GT query并得到预测值,和原GT一对一计算损失进行去噪。去噪部分和bipartite部分的attention mask如下图所示,避免在self attention中出现信息泄露。对于去噪部分的query,原GT bbox通过随机缩放长宽增加噪声,而GT label通过随机翻转到其他label实现。为了更好的区分去噪部分和bipartite部分的label embedding,在label embedding中添加了一个标志位,如果query属于去噪部分,则该指示符为 1,否则为 0。

在这里插入图片描述

DN-DETR 在相同的环境下取得了显著的改进,并在以 ResNet-50 为骨干的 DETR 类方法中取得了最好的结果(AP分别为 43.4 和 48.6,训练次数为 12 次和 50 次)。
在这里插入图片描述

在这里插入图片描述

从某种角度来看,DN-DETR 的处理措施有些类似于知识蒸馏,不同在于知识蒸馏使用一个老师模型去指导学生模型,而DN-DETR使用了较易学习的噪声GT加快bipartite graph matching的收敛。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

dn-detr:通过去噪任务加速detr训练 的相关文章

  • Splinter使用中遇到的问题集锦

    已经解决 1 selenium common exceptions ElementNotVisibleException Message element not visible 2 selenium common exceptions In
  • 【py小游戏系列】吃豆人,儿时的回忆

    hello大家好 今天我又发现了个有趣的小玩意 我是专写有趣小玩意的老诗 老规矩 先上效果图 这是一个吃豆人的小游戏 我们8090后这一代人肯定会碰到过 黄点是我们自己 红点就是怪物们 这是最原始版的电子游戏 然后我们可以在随便一个地方新建
  • 华为OD机试 - 查找重复代码(Java)

    题目描述 小明负责维护项目下的代码 需要查找出重复代码 用以支撑后续的代码优化 请你帮助小明找出重复的代码 重复代码查找方法 以字符串形式给定两行代码 字符串长度 1 lt length lt 100 由英文字母 数字和空格组成 找出两行代
  • 微信小程序直播live-player-plugin

    Hi 2020 今年年初 微信小程序推出了最新的直播组件 在公测期间给了一部分公司使用的权限 恰好我很有幸接触到了它 下面就是我们使用的过程 一部分功能没有开发 也就先介绍这些 后续在进行补全哦 项目根目录的 app json 分包中引用
  • Python爬虫之Js逆向案例(15)-XX话题批量获取&保存到CSV文件

    声明 XX话题批量获取分析仅用于研究和学习 如有侵权 可联系删除 大家好 本期分享的内容是一个关于批量获取话题的案例 示例URL aHR0cHM6Ly93d3cuemhpaHUuY29tL3RvcGljLzIxMjM4NDE4L3RvcC1

随机推荐

  • linux 删除命令

    前言 文件基本属性 在 Linux 中第一个字符代表这个文件是目录 文件或链接文件等等 当为 d 则是目录 当为 则是文件 若是 l 则表示为链接文档 link file 若是 b 则表示为装置文件里面的可供储存的接口设备 可随机存取装置
  • vmware的存储管理-磁盘扩容后类型变为延迟置零的处理

    有时不想增加驱动 给原有的存储空间扩容 如以下 对磁盘6的空间有原来的200GB扩大到320GB 遗憾的在按照编辑设置中的操作后 磁盘的类型有厚置备置零变成了厚置延迟备置零 不知何原因 后果是此盘不能被用于集群盘啦 按照官方文档 可用vmk
  • 拯救者系列Y9000/R9000/Y7000/R7000款,安装Ubuntu18.04双系统教程,出现亮度无法调节、wifi无适配器、无声音、无蓝牙、触摸板失灵、外接显示器问题(最终篇)

    很多朋友应该跟我一样 兴高采烈的买了台2022最新款拯救者Y9000P笔记本 然后安装Ubuntu18 04之后 发现毛病太多了 亮度无法调节 wifi无适配器 无声音 无蓝牙 触摸板失灵 然后你就去网上各种找教程 大家说的五花八门 但是好
  • RS485总线详解

    RS485总线详解 前言 一 常见接口划分 二 RS485概述 一 简介 二 接口 引脚图 三 RS485总线详解 一 RS485总线概述 二 差分传输 三 原理图 三 RS485与RS232的区别 四 应用详解 一 接口结构 二 与RS
  • aiVMS----CentOS7.6安装Nginx

    安装所需环境 一 gcc 安装 安装 nginx 需要先将官网下载的源码进行编译 编译依赖 gcc 环境 如果没有 gcc 环境 则需要安装 yum install gcc c 二 PCRE pcre devel 安装 PCRE Perl
  • 【vue】禁止重复点击 发送多次请求

    在提交按钮添加loading 通过loading状态防止多次点击 Element https element eleme cn 2 13 zh CN component button div class flex c div
  • 如何领养微信聊天机器人

    我们知道 微信聊天机器人 订阅号本身就是一个机器人 所有用户粉丝都可以直接与其对话 然而订阅号机器人并不是自己的 如何能够拥有一个自己的机器人呢 领养属于自己的微信聊天机器人 可以获得如下功能 1 将个人微信账号转换为聊天机器人 与微信好友
  • 智能合约生成合约地址

    智能合约生成合约地址的第二种方式 Create2 以一道例题解释 计算地址有两种方式 Create keccak256 rlp encode deployingAddress nonce 12 Create2 keccak256 0xff
  • Mayor's posters (线段树+离散化)

    Mayor s posters 线段树 离散化 The citizens of Bytetown AB could not stand that the candidates in the mayoral election campaign
  • 在sqlserver2000数据库中怎么导入.bak文件

    打开企业管理器 新建一个数据库 右击选择还原数据库 选择从设备 选择添加 选择 bak文件 确定 从选项中选择在现有数据库上强制还原 确定 数据库中对数据的操作是一大重要技能 其中 数据的恢复和还原也是常做的事 不知你是否在数据库恢复时遇到
  • 空间复杂度

    基本概念 空间复杂度是对一个算法在运行过程中临时占用存储空间大小的一个量度 我们用 S n 来定义 计算方法 1 空间复杂度 O 1 如果算法执行所需要的临时空间不随着某个变量n的大小而变化 即此算法空间复杂度为一个常量 可表示为 O 1
  • 深度学习框架:tiny_dnn分析(1)—————VS2015编译

    深度学习已经很流行了 主流的框架现在有很多 本人一直以来都是使用的caffe 之前也分析过整个caffe的框架 整个框架相对来说第三方依赖库比较多 作为入门的分析不太合适 这里我想和大家分析的是tiny dnn 这是一个比较小巧的框架 非常
  • 【Qt】QWidget对样式表设置边框无效的解决方法

    1 现象 在对QWidget使用样式表时无效 QWidget MyWgt border 1px solid gray 2 原因 原因是QWidget只支持background background clip和background origi
  • 爆发在即的赛道:十大生态30家常用跨链桥盘点

    写给用户的跨链桥工具集指南 作者 Azuma 编辑 郝方舟 出品 Odaily星球日报 ID o daily 随着 Solana Avalanche Fantom 等公链的集体爆发 新兴生态的造富效应正在抬头 为了追逐这些全新的财富机会 用
  • Materials Studio安装教程

    Materials Studio安装教程简易分享 看过了太多安装教程 需要破解license 总结了一下 出一版简单直装的教程供大家讨论 安装包 安装包放在pan了 链接 https pan baidu com s 1iEVBzuDzE T
  • nuclei poc模板编写笔记(二)

    匹配器 匹配器允许对协议响应进行不同类型的灵活比较 非常易于编写 并且可以根据需要添加多个检查以实现非常有效的扫描 类型 可以在请求中指定多个匹配器 基本上有6种类型的匹配器 Matcher Type Part Matched status
  • openGL之API学习(十)glReadBuffer

    该函数主要是确定颜色缓冲区的来源 不会影响到深度 模板等缓冲区的读取 这里的设置将会影响到glReadPixels glCopyTexImage1D glCopyTexImage2D glCopyTexSubImage1D glCopyTe
  • 解决Eclipse建立Maven项目后无法建立src/main/java资源文件夹的办法

    建立好一个Maven项目后 如果Java Resources资源文件下没有src main java文件夹 并且在手动创建这个文件时提示 已存在文件 这说明 在这个项目配置中已经有了src main java这个文件夹 至于为什么不显示 我
  • 人脸属性识别 - 使用多任务学习模型在CelebA数据集上进行人脸属性识别任务

    在本博客中 我们将介绍如何使用多任务学习 Multi Task Learning MTL 模型在CelebA数据集上进行人脸属性识别 我们将详细介绍数据准备 模型构建 训练和评估的过程 最后 我们将展示如何使用训练好的模型对新的图像进行属性
  • dn-detr:通过去噪任务加速detr训练

    dn detr 通过去噪任务加速detr训练 论文链接 https arxiv org abs 2203 01305 自DETR问世以来 transformer被引入到了目标检测领域 DETR通过引入query和bipartite grap