Anchor DETR

2023-11-04

Anchor DETR: Query Design for Transformer-Based Detector

（2021.9）

1.DETR的object query是学习的，没有物理意义也不能解释每个query注意哪。作者认为学习出来的object query不能关注特定的区域。本文提出来，object query的是基于anchor point的，这种设计下，每个object query只关注anchor点周围的目标，另外，每个object query可以在一个位置上预测多个目标(多模式)。

2.设计了一种注意力变体，可以减少内存成本。

Introduction

本文基于DETR做改进，肯定得先说一下DETR的优点就是一个可学习的object query集合来推理目标物和全局图像的关系。然后转折，说DETR局限了，也就是学习到的object query难以解释，也不能关注特定位置。

这幅图来自DETR原文，每个图像代表一个object query，点代表最后预测到的目标的位置，可以看到，各个关注的区域很大。没有关注特定位置所以限制了效果。

Motivation

回顾了CNN-based检测器，anchors包含可解释的物理信息并且对位置高度关联。所以提出了基于anchor point的新颖的query设计。我们编码anchor point的坐标作为object query，这样object query就有明确的物理意义了。

让每个object query关注特定位置，会带来问题：一个object query只能预测一个目标，如果那个location有多个目标物呢？作者给出解答：可以让其他的object query协助预测啊，可以让每个object query负责较大区域啊。

所以object query设计，对每个anchor point添加了多个模式，使每个anchor point可以预测多个目标。上图中分别表示三种模式的预测结果分布，能看出关注在anchor point周围。

设计了一种注意力变体-- Row-Column Decouple Attention (RCDA)。

它将2D的key feature解耦成1D的行特征和1D的列特征，然后依次进行行注意与列注意。RCDA可以在保障性能前提下减少内存成本。

Method

Anchor Points

Cnn-based检测器中，anchor point总是在feature map的相应位置。但在transformer-based检测器中更灵活，anchor point可以是被学习的点，均匀的网格点，或者其他人工划分的点。本文选择前两者。

均匀划分的点；（b）随机初始化，采用0-1的均匀分布并可以学习的点。

有了anchor point，预测边界框的中心位置(ˆCx，ˆCy)将被添加到相应的anchor point作为最终预测，就像在Deformable DETR中一样

Attention Formulation

下标f表示特征，p表示position embedding。

DETR的decoder有两种：self-attention & cross-attention。

Self-attention中：Kf和Vf与Qf相同；Kp和Qp相同。

Anchor Points to Object Query

（2）式中Qp是可学习的编码（in DETR），但是，本文提出了新的object query设计方式。

Multiple Predictions for Each Anchor Point

Row-Column Decoupled Attention

通过1-D全局平均池化，将wh*c的key-feature解耦成w*c 与 h*c。

Experiments

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Anchor DETR 的相关文章

【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
用CHAT写一份标题为职业教育教师教学能力提升培训总结

CHAT回复标题职业教育教师教学能力提升培训总结一活动概述本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行来自全校的60位职业教育教师参与了此次培训主讲人为享有盛名的教育专家马丁先生二培训内容与
基于java的ssh医院在线挂号系统设计与实现

基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机随着信息技术的迅速发展和应用医院在线挂号系统已成为医院管理的重要组成部分传统的挂号方式存在许多
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
主流进销存系统有哪些？企业该如何选择进销存系统？

主流进销存系统有哪些企业该如何选择进销存系统永久免费的软件这个可能还真不太可能有而且就算有也只能说是相对免费因为要么就是数据存量有限要么就是功能有限数据信息都不保障并且功能不完全免费免费软件免费进销存诸如此类
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

谭传奇-individual_project_word_frequency

首先印证了闫导的一句话一星期都在写软工作业其实也没有那么夸张了装Win7花了1天装VS2012加熟悉Win7花了接近2天真正写作业的时间也没有那么长言归正传我估计大概用5个小时左右实际前前后后大大小小时间加起来6 7个小时
2020年第十一届蓝桥杯决赛Python组（真题+解析+代码）：阶乘约数

1 真题 2 解析难度系数考察题型数论涉及知识点约数定理思路分析一开始我是想着直接分解因数结果100 的时间复杂度实在太大所以这道题只能靠巧取解决搬出适合本题的工具质数唯一分解公式质数有2 3 5 7 11 13
关于mongodb服务自动停止问题

昨天发现系统宕机了查了下原因是mongodb服务停了看了下日志 2017 10 18T18 09 59 181 0800 I CONTROL signalProcessingThread got signal 1 Hangup will
RIDE元素定位简单用法二

悬浮菜单隐藏菜单定位和点击功能定位鼠标移动到该位置时菜单显示先定位到鼠标停留位置然后定位隐藏菜单或链接定位方法 Mouse Over 我们的服务路径 Click Link 测试点击的链接关于定位鼠标介绍 Mouse Over
PAT 5 凑算式(dfs)

凑算式这个算式中A I代表1 9的数字不同的字母代表不同的数字比如 6 8 3 952 714 就是一种解法 5 3 1 972 486 是另一种解法这个算式一共有多少种解法注意你提交应该是个整数不要填写任何多余的内容或说明性
彻底解决Jetson Inference关于box.com连不上的问题

jetson inference教程国内镜像 1 安装git和cmake 并检出库到本地 sudo apt get install git cmake git clone GitHub dusty nv jetson inference
2021 10-24

let person name 张三 age 23 let p new Proxy person set target prpoName value Reflect set target prpoName value get target
在物联网中应用机器学习

欢迎大家前往腾讯云社区获取更多腾讯海量技术实践干货哦本文由未来守护者发表于云社区专栏本项目探讨如何将机器学习 Machine learning 应用到物联网 IoT Internet of Things 中我们将使用 Andro
如何在windows下使用vscode畅快的调试bash shell

前言在linux随然有很多的可以调试的bash的工具但是如果不用ubuntu或者其它linux系的桌面系统只有命令行的情况下还是很吃力的当然了大神级别可以畅快的书写并调试但是对于我等小白空格多一个少一个只能望尘莫及了所以
Python 安装dlib解决办法

pypi python org pypi dlib 19 6 0 下载 dlib 19 6 0 cp36 cp36m win amd64 whl 成功安装 dlib 但是import 时候失败尝试 pip install dlib 19
matlab实现神经网络算法,人工神经网络matlab代码

求一段神经网络MATLAB代码 50 function presim ss net simnonlin y d n y 时间序列数据列向量 d 时间延迟参数正整数 n 用于训练的点的个数正整数trainset gettrain y d
新手学习python语言基础知识第四天

语言基础 day4 循环 01 for循环循环让代码重复执行代码写一遍运行的时候可以执行多次 1 for循环 for循环如图语法 for 变量 in 序列循环体说明 for in 关键字固定写法变量写一个变量名可以是已
JAVA ~ FFmpegFrameRecorder用H264编码封装mp4 有声音无图像

1问题描述最近公司做的关于摄像机录制视频保存的问题发送录制了视频上传至服务器中在浏览器上播放有声音无图像因为自己是这方面的小白在自己也在前面博客中也分享了rtsp流媒体如何播放及在H5中嵌入vlc 帧抓取图片及录制视频等文章希望对
使用ai实现后端端口的调用

一创建flask框架 1 创建框架提示词我需要一个flask框架的demo 把端口号改为8080 需要热加载功能支持在线更改请给我代码导入一些依赖库 from flask import Flask render template
视频播放设计测试用例

功能测试 1 视频资源能否正常获取无论从服务器后台或者客户端添加播放是否正常 2 存在多个视频时能否上下滑动无论看完未看完 3 如果一个视频涉及另外一个切换到相应视频能否正常播放 4 视频音量测试在无声音播放是否正常声音是否正
vue项目代码中代理部署后nginx请求代理

vue项目代码中代理 vue2 0 文件地址 config index js module exports dev Paths assetsSubDirectory static assetsPublicPath proxyTable 设
金融时间序列分析：Python基于garch模型预测上证指数波动率、计算var和var穿透率、双尾检验

目录一收益率波动效应的分析 1 1 收益率序列平稳性检验 1 2 建立AR p 模型 1 3 Ljung Box混成检验残差序列的相关性判断是否有ARCH效应 1 4 建立ARCH模型二 GARCH模型与波动率预测 2 1 建立GA
后端Springboot框架搭建APi接口开发（第一章）

本文章以IDEA为开发工具使用SSM框架进行项目编写第一节设计并创建数据库我们用一个简单的用户表进行操作演示首先创建Data数据库 create database data 创建User数据表表中包含用户邮箱用户姓名用户密码
C++ placement new使用

placement new重载来原来的operator new 且placement new不能被即需重载 placement new是在原有的一块地址上继续创建一个对象注意对象类型要一致这样的操作的优势有两个 1 不用花时间在找合适的
Anchor DETR

Anchor DETR Query Design for Transformer Based Detector 2021 9 1 DETR的object query是学习的没有物理意义也不能解释每个query注意哪作者认为学习出来的ob