DETR论文解读

2023-11-13

DETR基本介绍

DETR的一个创新是端到端的目标检测,它能够将目标检测看做成集合预测问题,而不需要像之前的目标检测算法需要anchor或者nms等,总之就是一个将CNN和transformer结合的一个新颖的目标检测框架,改变预测头还可以进行分割等任务

算法框架

DETR的整体架构如下所示,要检测的图片首先通过CNN提取特征,根据原文这里是提取的ResNet最后一层特征,然后将特征通过Transformer的Encoder与Decoder,这里的encoder与decoder有点类似attention is all you need论文中的编解码器,但是有区别的是这里的decoder处加了100个object queries,这也是本文最关键的部分吧。随后这100 query来搜索图中的目标并进行分类(分别有一个bbox head和cls head),最后通过匈牙利算法进行匹配GT的bbox和相应的类别计算loss

更加具体的框架图如下所示

匈牙利匹配细节

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

DETR论文解读 的相关文章

  • Linux自学笔记

    Linux自学笔记 06 常用命令 文件目录类 Linux自学笔记 01 文件系统和目录结构 Linux自学笔记 02 VIM编辑器的安装与使用 Linux自学笔记 03 Linux网络配置 Linux自学笔记 04 远程登录 Linux自
  • 高速模数转换器(ADC)的INL/DNL测量

    摘要 尽管积分非线性和微分非线性不是高速 高动态性能数据转换器最重要的参数 但在高分辨率成像应用中却具有重要意义 本文简要回顾了这两个参数的定义 并给出了两种不同但常用的测量高速模数转换器 ADC 的INL DNL的方法 近期 许多厂商推出
  • 微信小程序 ---- 【invalid credential, access_token is invalid】

    报错返回 errcode 40001 errmsg invalid credential access token is invalid or not latest rid 6004f3da 1529ba72 5c345f67 报错原因 a
  • oled拼接屏有哪些安装方法?

    嘉峪关是一个历史悠久的城市 也是一个旅游胜地 为了更好地展示城市的文化和旅游资源 嘉峪关市政府决定在市区的重要场所安装oled拼接屏 oled拼接屏是一种高清晰度的显示屏 具有高亮度 高对比度 高色彩饱和度等优点 它可以将图像和视频以更清晰
  • qtp的基本使用方法(1)

    1 action qtp为每一个action生成相应的测试文件和目录 对象库也是和action绑定的 用action 来划分和组织测试流程 编辑action 修改action的名字 action properties 增加action in

随机推荐