【目标检测】OneNet: Towards End-to-End One-Stage Object Detection

2023-11-19

label assignment是指，在训练过程中如何将某个prediction指定给某个GT，用于计算损失，训练网络。

对于上一篇文章，他们首先用one-to-one label assignment替换了one-to-many label assignment，并且不用hand-craft label assignment，而是提出综合考虑位置、类别置信度和IoU三个指标计算得分，取得分最高的POTO。在这基础上，提出3DMF，提高局部卷积的差异，再进一步提高anchor之间的差异。最后，添加一个类似ATSS的one-to-many辅助损失，来学习特征。

Abstract

对于one-stage detectors来说，label assignment时缺少classification cost，是去掉NMS的主要障碍。
当前one-stage目标检测器仅通过location cost指派标签，例如IoU和点距离。因为缺少classification cost，前向过程中，会产生大量有着高置信度分数的bbox，这就是要使用NMS的原因。
本文提出Minimum Cost Assignment，同时包含classificatio和location cost。
在COCO上测试，OneNet在图片分辨率为512的情况下，取得35.0 AP/80 FPS（ResNet-50）和37.7 AP/50 FPS（ResNet-101）的结果。

Introductions

sparse candidates和multiple-stage refinement detectors（DETR、Deformable DETR和Sparse R-CNN），他们无需NMS，直接输出检测结果。然而，对于dense candidates和One-stage refinement检测器，还有更大的发展潜力。

总的来说，本文优点如下：

整个网络是全卷积，并且端到端训练的。没有RoI和注意力交互。
Label assignment是依靠分类和定位代价，而不是手工设计的启发式规则或复杂的二分图匹配。
没有后处理过程，例如NMS和max-pooling，使得模型整体高效。
仅通过定位代价会导致无法选出最优的anchor（它的类别标签可能有误）。

Label Assignment

Ccls是focal loss，除了选中的正样本，其余都视为负样本。

OneNet

推理：最后输出top-k (例如：100)的box

Multi-head Training（可选）

（1）Cascading heads

（2）Weight-sharing：分类和回归的卷积在每个头中共享权重

（3）Large Learning rate，当使用（1）和（2）时，可以使用大学习率。

（4）Single-head Inference：仅使用first stage去输出最终结果，不使用其他stages。这种策略相较于multiple-head，结果仅稍微掉了一些。这使得降低计算量，但不至于损失太多正确率。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测

【目标检测】OneNet: Towards End-to-End One-Stage Object Detection 的相关文章

基于深度学习的高精度人体摔倒行为检测识别系统（PyTorch+Pyside6+YOLOv5模型）

摘要基于深度学习的高精度人体摔倒行为检测识别系统可用于日常生活中或野外来检测与定位人体摔倒行为目标利用深度学习算法可实现图片视频摄像头等方式的人体摔倒行为目标检测识别另外支持结果可视化与图片或视频检测结果的导出本系统采用YOLO
【CV】第 10 章：使用 R-CNN、SSD 和 R-FCN 进行目标检测

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
p2b网络

把p2b的工作推广到p2rb 目的学习目标检测熟悉目标检测为自己写论文打基础我的碎碎念真的是fuck了自己这个东西整了这么久还是没有整出来从5月分我就开始了把因为考试因为自己喜欢玩游戏因为我tm真的浪费了好多时间像个
【YOLOv5-6.x】解决加入CA注意力机制不显示FLOPs的问题

1 问题描述问题源自之前写的一篇博客魔改YOLOv5 6 x 中加入ACON激活函数 CBAM和CA注意力机制加权双向特征金字塔BiFPN 尝试在YOLOv5的backbone中加入Coordinate Attention 虽然加入
【毕业设计】深度学习卫星遥感图像检测与识别系统（目标检测）

文章目录 0 前言 1 课题背景 2 实现效果 3 Yolov5算法 4 数据处理和训练 5 最后 0 前言 Hi 大家好这里是丹成学长的毕设系列文章对毕设有任何疑问都可以问学长哦这两年开始各个学校对毕设的要求越来越高难度也越来越
目标检测之YOLOv1算法分析

网络结构卷积层池化层全连接层输入 448 448 448 448 448 448大小的图片输出 7 7
【计算机视觉

文章目录一检测相关 11篇 1 1 Follow Anything Open set detection tracking and following in real time 1 2 YOLO MS Rethinking Multi
【目标检测】34、FSAF: Feature Selective Anchor-Free Module for Single-Shot Object Detection

文章目录一背景二方法 2 1 Ground truth and loss 2 2 Online Feature Selection 2 3 将 RetinaNet 和 FSAF 联合后如何训练和测试三效果论文 Feature
华为Atlas200dk使用第三步------只用一根网线登录华为开发板

华为开发板Atlas200DK ARES500DK开发板开发板使用心得系列文章目录第三章一根线登录华为开发板目录前言同时使用网线和串口线连接开发板有点多余线多显得乱串口连接开发板也比较繁琐因此本文给大家提供两种使用一根网线
YOLOV5加速之TensorRT篇

之前写过一篇Android版本yolov5s的博客最近工作搞了下TensorRT 也遇到几个坑不过最终还是实现了做一下小小的分享这里直接上github上大牛的连接我的代码是在他的基础上改的里面有很多模型的加速直接看里面的yolov
SimMIM：一种更简单的MIM方法

自从何恺明的MAE 点击蓝字查看文章详情出来之后基于MIM Masked Image Modeling 的无监督学习方法越来越受到关注这里介绍一篇和MAE同期的工作 SimMIM A Simple Framework for Mask
tensorRT部署之代码实现 onnx转engine/trt模型

tensorRT部署之代码实现 onnx转engine trt模型前提已经装好显卡驱动 cuda cudnn 以及tensorRT 下面将给出Python C 两种转换方式 1 C 实现项目属性配置好CUDA tensoeRT库通常
项目设计：基于YOLO目标检测算法的安全帽/口罩/汽车/行人/交通标志...检测

本文将详细介绍YOLO目标检测算法该算法支持各种目标检测包括安全帽汽车造价交通标志等其他毕业设计题目推荐参考毕业设计电子通信计算机物联网专业毕业设计选题参考嵌入式linux 单片机STM32 web 图像 htt
目标检测算法改进系列之添加变核卷积AKConv模块

AKConv变核卷积 KConv的主要思想 AKConv 可变核卷积主要提供一种灵活的卷积机制允许卷积核具有任意数量的参数和采样形状这种方法突破了传统卷积局限于固定局部窗口和固定采样形状的限制从而使得卷积操作能够更加精准地适应不同数
目标检测中的损失函数：IOU_Loss、GIOU_Loss、DIOU_Loss和CIOU_Loss

文章目录前言 1 IOU Loss Intersection over Union Loss 2 GIOU Loss Generalized Intersection over Union Loss 3 DIOU Loss Distanc
Far3D：直接干到150m，视觉3D目标检测新思路（AAAI2024）

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取 gt gt 点击进入自动驾驶之心 3D目标检测技术交流群论文作者自动驾驶Daily 编辑自动驾驶之心近来在 Arxiv 读到一篇纯视觉环视感知的新工作它延
目标检测YOLO实战应用案例100讲-自动驾驶复杂场景下目标检测（续）

目录 3 2 YOLOv5框架的分析 3 3改进算法的基本思想 3 4改进聚类算法 3 5重构损失函数模型和NMS算法 lt
目标检测深度学习的anchor

在目标检测深度学习中 Anchor是一种预定义的框用于在图像中采样不同位置尺度和长宽比例的区域作为目标检测模型的候选区域 Anchor是Faster R CNN等基于Anchor的目标检测算法的核心概念具体来说 Anchor有以下几
深度学习目标检测全连接层什么意思

在深度学习目标检测中通常我们使用卷积神经网络 Convolutional Neural Network CNN 进行特征提取 CNN 的主要结构包括卷积层和池化层用于从输入图像中提取特征然而为了最终输出目标的类别和位置信息通常在网
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初

随机推荐

有时间再看decode详解

Oracle 中 decode 函数用法含义解释 decode 条件值1 返回值1 值2 返回值2 值n 返回值n 缺省值该函数的含义如下 IF 条件值1 THEN RETURN 翻译值1 ELSIF 条件值2 THEN RETU
冲刺春招-精选笔面试 66 题大通关 day6

day6题目 33 搜索旋转排序数组 54 螺旋矩阵 bytedance 006 夏季特惠学习计划链接冲刺春招精选笔面试 66 题大通关今日知识点二分模拟 01背包难度为中等中等字节简单 33 搜索旋转排序数组整数数组
ARouter（二）源码解析

前言这一篇我们来具体看一下ARouter的实现原理如果你之前没有接触过ARouter 可以先阅读上一篇 Android 从零开始打造自己的深度链接库一 ARouter简介废话不多我们赶紧分析源码正文首先我们从github下载最
中文信息处理实验8——基于逻辑斯蒂回归模型的文本分类

目录实验目的实验要求实验内容及原理参考代码实验结果实验目的加深对汉语文本信息处理基础理论及方法的认识和了解锻炼和提高分析问题解决问题的能力通过对具体项目的任务分析数据准备算法设计和编码实现以及测试评价几个环节的练习
win10系统C盘出现感叹号及加密图标解除

近期遇到Win10系统C盘图标加密情况经过搜索查找最终解决并对操作进行简单记录 1 以管理员身份打开命令行窗口 2 输入 manage bde off c 3 相关指令加密指令 manage bde on c 查看状态指令 manag
使用定时框架Quartz.net时，发布到服务器后无法正常执行定时任务

问题描述使用Quartz net每天定时执行某个任务时未能正常执行每次在本地测试时设置了短的时间间隔都能正常执行任务但是挂到服务器后设置定时执行时间为几个小时却不能正常执行我们要执行的操作原因 IIS的程序池有一个闲置超
_Linux网络数据包的揭秘以及常见的调优方式总结

作为业务 SRE 我们所运维的业务常常以 Linux TCP UDP daemon 的形式对外提供服务 SRE 需要对服务器数据包的接收和发送路径有全面的了解以方便在服务异常时能快速定位问题以 tcp 协议为例本文将对 Linux
自己封装一个类express路由框架

今天用了Node封装一个简单的类似express框架的路由首先先看看没封装之前的server路由代码 const http require http const url require url const ejs require ej
Java变量与常量书写方式与规范

变量变量是什么变量是可以变化的量 Java是一种强类型语言每个变量都必须声明其类型 Java变量是程序中最基本的存储单元其要素包括变量名变量类型和作用域 type varName value varName value 数据类型
链表指定区间反转

题目反转从位置 m 到 n 的链表请使用一趟扫描完成反转说明 1 m n 链表长度输入 1 gt 2 gt 3 gt 4 gt 5 gt NULL m 2 n 4 输出 1 gt 4 gt 3 gt 2 gt 5 gt NULL 头
java公钥签名,ping++ java验签(签名，公钥，charge)怎么获取

packageexample importjava io FileInputStream importjava security InvalidKeyException importjava security KeyFactory impo
Halcon模板匹配

Halcon模板匹配 Halcon模板匹配的方法模板匹配的流程基于形状的模板匹配的思路原理 Halcon模板匹配的方法模板匹配的流程基于形状的模板匹配的思路读取图像转灰度图 dev close window dev open
vue项目打包部署到linux tomcat服务器，解决一刷新就报错404问题

1 部署到服务器前更改webpack配置修改index js中以下配置 2 运行npm run build 或者cnpm run build命令打包完成后在项目的根目录dist文件下生成了如下文件 3 tomcat的webapps创
问题解决——使用串口调试助手发送控制字符协议指令＜ESC＞!?

问题解决使用串口调试助手发送控制字符协议指令参考文章 1 问题解决使用串口调试助手发送控制字符协议指令 2 https www cnblogs com wlsandwho p 4202094 html 备忘一下
丁鹏：多角度回顾因果推断的模型方法

来源集智俱乐部本文约23000字建议阅读20 分钟本文整理自丁鹏老师的8篇短文从多角度回顾了因果推断的各种模型方法导读推断因果关系是人类思想史与科学史上的重要主题现代因果推断的研究始于约尔辛普森悖论经由鲁宾因果模型
云服务器是什么? 云服务器有哪些选择?

欢迎前往我的个人博客云服务器查看更多关于云服务器和建站等相关文章随着互联网技术的发展和云计算技术的应用越来越多的企业倾向于使用云服务器来满足其不断增长的计算需求云服务器是一种基于云计算技术的虚拟服务器它能够为企业提供高性能可靠灵
【算法竞赛】Python快速入门指南

该指南由GPT4编写用于快速入门蓝桥杯Python组当然仅限入门而已本指南由GPT 4生成我只是负责引导并对内容进行整理和补充一直以来我都是使用C 作为算法竞赛语言但是奈何C 组太卷自己又太菜于是另谋他路 Prompt模
【AD20】快速且只选中部分自己想要的同类型的元件

在project属性框里面可以选择所有如下图所示内容这个是一个过滤器里面有多种小选项比如 Components 元件 Pads 焊盘 Texts 文本选择哪个就只能选择对应的部分比如只选择文本在画图区域框选发现只有文本才
数位拆分

4 数位拆分v1 0 现有一个4位数的正整数n 4321 即n是一个已知的数固定为4321 编写程序将其拆分为两个2位数的正整数43和21 计算并输出拆分后的两个数的加减乘除和求余的结果例如n 4321 设拆分后的两个整数为a b
【目标检测】OneNet: Towards End-to-End One-Stage Object Detection

label assignment是指在训练过程中如何将某个prediction指定给某个GT 用于计算损失训练网络对于上一篇文章他们首先用one to one label assignment替换了one to many label

热门标签