论文笔记：CVPR2021 OTA: Optimal Transport Assignment for Object Detection

2023-10-31

proporse：利用全局信息，一对多的进行标签匹配（label assignment）

related work：

fixed label assignment:

anchor-based: 以IOU阈值判断

anchor-free：如FCOS，关键点在物体中心的周围则为pos，

dynamic label assignment:

现有的算法要么未从全局角度利用上下文信息，要么如DETR中利用全局信息但其中的Hungarian algorithm只适合一对多。

Method：

Optimal Transport Problem

m个供货商，第i个供货商有s_i的商品

n个需求者，第j个需求者需d_j的商品

供货商i给需求者j需要的cost为c_ij

传输路径pi={pi_ij | i = 1,...,m, j = 1,...,n}

需要最小化transport cost

使用快速迭代算法：Sinkhorn-Knopp求解

OT for Label Assignment

OD中FPN的输出有 m gt targets 和 n anchors，将每个gt看成有k个单元的pos样本，每个输出需要一个单元。讲一个单元从gt_i传输到anchor_j 的代价如下：

除了pos，训练时大量的anchors还会被分配为neg。最佳传输涉及所有的anchors，所以引入另一个supplier，background，包含n - m×k。

C_fg和C_bg进行concat，得到（m+1）*n，其中若i < m , 则s = k，i = m+1，s = (n-mk)

Sinkhorn-Knopp求解 [2]

代码复现：

参考：

[1] 论文阅读|目标检测之基于OTA，以最佳传输优化来实现新的基于CNN的一对多标签分配策略_yanghao201607030101的博客-CSDN博客

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

label assignment

目标检测

论文笔记：CVPR2021 OTA: Optimal Transport Assignment for Object Detection 的相关文章

p2b网络

把p2b的工作推广到p2rb 目的学习目标检测熟悉目标检测为自己写论文打基础我的碎碎念真的是fuck了自己这个东西整了这么久还是没有整出来从5月分我就开始了把因为考试因为自己喜欢玩游戏因为我tm真的浪费了好多时间像个
YOLOV2个人理解总结

YOLOv2框架图 YOLOv2改进之处 1 Batch Normalization BN Batch Normalization 层简单讲就是对网络的每一层的输入都做了归一化这样网络就不需要每层都去学数据的分布收敛会快点原来的YOL
全新范式

在本文中提出了一种简单的注意力机制Box Attention 它支持网格特征之间的空间交互从感兴趣的Box中采样并提高了Transformer针对多个视觉任务的学习能力具体来说介绍的BoxeR 即Box Transformer的缩写
基于YOLOv8模型的烟火目标检测系统（PyTorch+Pyside6+YOLOv8模型）

摘要基于YOLOv8模型的烟火目标检测系统可用于日常生活中检测与定位烟火目标利用深度学习算法可实现图片视频摄像头等方式的目标检测另外本系统还支持图片视频等格式的结果可视化与结果导出本系统采用YOLOv8目标检测算法训练数据集
Pycharm上Modify Run Configuration的使用方法，带参数配置

前言我们在搭建yolo系列目标检测模型时往往需要对代码进行逐步调试及时发现错误所以本文在pycharm的基础上对yolov6中的infer py进行逐步调试首先我们在conda环境一切准备就绪的情况下能在终端tenminal中
import tensorflow as tf报错ModuleNotFoundError: No module named 'tensorflow'

在安装tenserflow和keras的时候安装完毕进行验证的时候会报错解决方法就是需要安装tf nightly 安装完毕错误就不再报了 pip install tf nightly
特定场景小众领域数据集之——焊缝质量检测数据集

写这篇文章最大的初衷就是最近频繁的有很多人私信问我相关的数据集的问题基本上都是从我前面的目标检测专栏里面的这篇文章过来的感兴趣的话可以看下轻量级模型YOLOv5 Lite基于自己的数据集焊接质量检测从零构建模型超详细教程保姆级的
【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏

论文速递 CVPR2022 用于半监督物体检测的尺度等效蒸馏论文原文 Scale Equivalent Distillation for Semi Supervised Object Detection 获取地址 https ieeexp
人体三维重建——参数化人体方法简述

三维人体形状指的是以三维网格形式表示的人体几何形状模型按照 1 中的分类方式可以将三维人体形状重建粗略的分为参数化方法与非参数化方法本次先介绍参数化方法参数化人体形状重建方法依赖于某个基于统计得到的人体参数化模型仅需一组低维向量
快速椭圆检测代码调试记录

代码环境 Windows11 vs2019 opencv3 3 1 Debugx64 一代码注释 1 realpath PATH MAX basename 这几句是为了在Ubuntu中运行时寻找路径用的 Ubuntu需要比较严格的路径
YOLO算法v1-v3原理通俗理解

YOLO算法v1 v3原理通俗理解深度学习检测方法简述我们所使用的目标检测其实就是让机器在图片找到对应的目标然后给图片上的目标套上一个框框并贴上标签比如如果图片上有人就把人框起来并标注一个 person 使用深度学习进行目标检
【Transformer系列（3）】《Attention Is All You Need》论文超详细解读（翻译＋精读）

前言哒哒时隔好久终于继续出论文带读了这次回归当然要出一手王炸呀没错今天我们要一起学习的就是传说中的Transformer 在2021年Transformer一经论文 Attention is All You Need 提出就如龙
faster RCNN 的细节理解

1 anchors不同的大小但是采用了ROI pooling一样的策略都映射到3 3的卷积核上最后通过1 1的卷积核相当与全连接分成了18类 9个anchors的话 2 分类的时候 reshape 两次第一次为了softmax分类
睿智的目标检测54——Tensorflow2 搭建YoloX目标检测平台

睿智的目标检测54 Tensorflow2 搭建YoloX目标检测平台学习前言源码下载 YoloX改进的部分不完全 YoloX实现思路一整体结构解析二网络结构解析 1 主干网络CSPDarknet介绍 2 构建FPN特征金字塔
yolo 车辆测距+车辆识别+单目测距（双目测距）

基于yolo目标检测算法实现的车前道路中的车辆和行人检测并且可以估测出目标与本车之间的距离一视频展示 yolo车距1 订阅专栏获得源码提供完整代码无需看下文二单目测距原理图中有一个车辆且车辆在地面上其接地点Q必定在地面上
机器学习课程总结3--基本卷积神经网络+评价指标+目标检测与Yolo网络

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档目录一基本卷积神经网络 1 AlexNet 2 VGG 16 3 残差网络二常用数据集与评价指标 1 数据集 2 评价指标三目标检测 YOLO 1 1 目标检测问
【计算机视觉】消融实验(Ablation Study)是什么？

文章目录一前言二定义三来历四举例说明一前言我第一次见到消融实验 Ablation Study 这个概念是在论文 Faster R CNN 中消融实验类似于我们熟悉的控制变量法假设在某目标检测系统中使用了A B
项目设计：基于YOLO目标检测算法的安全帽/口罩/汽车/行人/交通标志...检测

本文将详细介绍YOLO目标检测算法该算法支持各种目标检测包括安全帽汽车造价交通标志等其他毕业设计题目推荐参考毕业设计电子通信计算机物联网专业毕业设计选题参考嵌入式linux 单片机STM32 web 图像 htt
仅使用卷积！BEVENet：面向自动驾驶BEV空间的高效3D目标检测

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取 gt gt 点击进入自动驾驶之心 BEV感知技术交流群论文作者 Yuxin Li 编辑自动驾驶之心写在前面个人理解 BEV空间中的3D检测已成为自动驾驶领域
目标检测YOLO实战应用案例100讲-自动驾驶复杂场景下目标检测（续）

目录 3 2 YOLOv5框架的分析 3 3改进算法的基本思想 3 4改进聚类算法 3 5重构损失函数模型和NMS算法 lt

随机推荐

L2-4 部落PTA

在一个社区里每个人都有自己的小圈子还可能同时属于很多不同的朋友圈我们认为朋友的朋友都算在一个部落里于是要请你统计一下在一个给定社区中到底有多少个互不相交的部落并且检查任意两个人是否属于同一个部落输入格式输入在第一行给出一个
hadoop3.2.1编译安装

基础环境 centos 7 7 三台 hadoop需要的环境 Requirements Unix System JDK 1 8 Maven 3 3 or later ProtocolBuffer 2 5 0 CMake 3 1 or new
echart 折线图设置y轴单位_如何让echarts中y轴的单位位于数值的右上角

展开全部 1 创建折线图的数据区包括年份和数据 2 仅选择数据区创建折线图插入选项卡图表62616964757a686964616fe78988e69d8331333363396364工具组折线图 3 得到的折线图x坐标不满足要求
c++可变参数模板函数

可变参数模版函数类型一致可变参数使用头文件 cstdarg va list arg ptr 开头指针 va start arg ptr n 从开头开始读取n个 va arg arg ptr T 根据数据类型取出数据 va end ar
jdk1.8升级后 sun.io.CharToByteConverter 错误处理

项目工程中用到jdk1 6相关方法可以使用但是升级到jdk1 8以后编译出现java lang NoClassDefFoundError sun io CharToByteConverter错误后经查询是jdk1 8版本中已经从s
前端02：CSS选择器等基础知识

CSS基础选择器设置字体样式文本样式 CSS的三种引入方式能使用Chrome调试工具调试样式 HTML专注做结构呈现样式交给CSS 即结构 HTML 和样式CSS相分离 CSS主要由量分布构成选择器以及一条或多条声明选择器给谁
深度学习10篇文章之Interleaved Group Convolution

本文主要讲解Ting Zhang的Interleaved Group Convolutions for Deep Neural Networks 该文对Group convolution有较为详细的讲解 Abstract 文章开篇引出了 I
新昌中学2021高考成绩查询,2021绍兴市地区高考成绩排名查询,绍兴市高考各高中成绩喜报榜单...

距离2018年高考还有不到一个月的时间了很多人在准备最后冲刺的同时也在关心高考成绩 2018各地区高考成绩排名查询高考各高中成绩喜报榜单尚未公布下面是往年各地区高考成绩排名查询高考各高中成绩喜报榜单想要了解同学可以参考下同时关
轻松学懂图（下）——Dijkstra和Bellman-Ford算法

概述在上一篇文章中讲述了Kruskal和Prim算法用于得到最小生成树今天将会介绍两种得到最短路径的算法 Dijlkstra和Bellman Ford算法 Dijkstra算法算法的特点属于单源最短路径算法什么是单源呢通俗的说
前端使用自定义指令实现埋点【vue3】

vue项目有时候会需要进行数据采集记录用户行为习惯而且很多页面都会使用到所以用vue自定义指令来实现埋点功能埋点的几种方式页面埋点浏览次数及时长等点击埋点每一次点击行为曝光埋点统计区域是否被用户浏览 import cre
神经网络量化----TensorRT深刻解读

神经网络量化 TensorRT深刻解读目录神经网络量化 TensorRT深刻解读前言一 TensorRT简介二难点 1 架构 2 功能三实现 1 conv和ReLU的融合 2 conv和ReLU的融合 quant utils
oracle 解锁账户_oracle用户解锁三种方法

ORA 28000 the account is locked 的解决办法 2009 11 11 18 51 ORA 28000 the account is locked 第一步使用 PL SQL 登录名为 system 数据库名称不变
python cplex优化包工具箱教程

python cplex优化包教程在做优化课题时常常需要用到优化算法个人优化算法专栏链接如下最优化实战例子需要掌握一些优化算法但是一些比较出名的优化工具箱还是要会用今天讲解下cplex工具箱 CPLEX Optimizer 是
RocketMQ-实际开发中遇到的几个问题

消息幂等性什么是幂等性一个操作任意执行多次与执行一次的结果相同这个操作就是幂等生产者发送消息之后为了确保消费者消费成功我们通常会采用手动签收方式确认消费 MQ就是使用了消息超时重传确认机制来保证消息必达场景 1 订单服务
使用Spark ALS模型 + Faiss向量检索实现用户扩量实例

1 通过ALS模型实现用户商品Embedding的效果获得其向量表示准备训练数据 M U I R 即用户集U 商品集I 及评分数据R 1 商品集I的选择可以根据业务目标确定商品候选集比如TopK热度召回或者流行度不高但在业务用
vite-plugin-svg-icons没有createSvgIconsPlugin成员

这天运行项目的时候发现报错大概意思就是在vite plugin svg icons中没有发现createSvgIconsPlugin模块 createSvgIconsPlugin is declared but its value is
（十四）Mybatis当中mysql以及oracle批量新增怎么做？

这篇文章主要讲述Mybatis当中针对于Mysql和orcle数据库批量新增的做法写的非常详细对大家的学习或者工作具有一定的参考学习价值需要的朋友们下面随着小编来一起学习学习吧目录 foreach标签 Mysql当中如何做第一种写
hadoop之HBase

传统的关系型按行存储行结构是固定的即使你不用也必须空到那里而不能没有此非关系型数据库是按列来存储的不会造成空间浪费 HBase的目标是管理超级大表数十亿行数百万列模仿谷歌的BigTable 底层使用HDFS Hbase
体验ChatGPT在具体应用场景下的能力与表现——vuedraggable的move多次触发问题

当下人工智能模型在满天飞今天拿一个具体的应用场景来体验下ChatGPT的能力与表现看看是否能解决实际问题顺便填一下之前遇到的一个具体的坑 vuedraggable的move多次触发问题背景背景是这样的实现低代码开发平台过程中
论文笔记：CVPR2021 OTA: Optimal Transport Assignment for Object Detection

proporse 利用全局信息一对多的进行标签匹配 label assignment related work fixed label assignment anchor based 以IOU阈值判断 anchor free 如FCOS

论文笔记：CVPR2021 OTA: Optimal Transport Assignment for Object Detection

论文笔记：CVPR2021 OTA: Optimal Transport Assignment for Object Detection 的相关文章

随机推荐

热门标签