CVPR 2021 Object Detection

2023-11-18

一. 关于3D有26篇:

3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection
ST3D: Self-Training for Unsupervised Domain Adaptation on 3D Object Detection
SRDAN: Scale-Aware and Range-Aware Domain Adaptation Network for Cross-Dataset 3D Object Detection
Unsupervised Object Detection With LIDAR Clues:利用雷达点云做无监督目标检测

二. 关于2D有55篇:

有几篇没有review,例如音频等考虑在内的一些论文直接略过了。

Semi-Supervise(6篇):

  1. Instant-Teaching: An End-to-End Semi-Supervised Object Detection Framework:从数据增强与训练策略的角度出发,完善teacher-student模式;
  2. Points As Queries: Weakly Semi-Supervised Object Detection by Points:数据标注采用了部分标bbox、部分在object上标点和类别的方式,模型采用了改进的DETR
  3. Humble Teachers Teach Better Students for Semi-Supervised Object Detection:EMA相关;
  4. Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object Detection:数据分析相关;
  5. Interactive Self-Training With Mean Teachers for Semi-Supervised Object Detection:对检测任务的训练过程中出现的,对同一张图片产生不同预测bbox之间存在的冲突进行处理(未完);
  6. Interpolation-Based_Semi-Supervised_Learning_for_Object_Detection:数据分析相关,bbox之间进行插值方式的融合;

positive unlabeled learning:
Positive-Unlabeled Data Purification in the Wild for Object Detection:从大量wild未标注数据中提纯数据,加入到训练中,提点(未完)

Cross Domain & Domain adaptive(4篇)

  1. Unbiased Mean Teacher for Cross-domain Object Detection:teacher-student模式,关于EMA,PASCAL VOC作为source domain(自然数据集),target domain是卡通风格数据集;
  2. Informative and Consistent Correspondence Mining for Cross-Domain Weakly Supervised Object Detection:PASCAL VOC作为source domain(自然数据集),target domain是卡通风格数据集,model沿用faster-RCNN;
  3. MeGA-CDA: Memory Guided Attention for Category-Aware Unsupervised Domain Adaptive Object Detection:model沿用faster-RCNN,VGG16 backbone,SGD优化器,数据集都是真实场景下的,一个是无人驾驶场景,一个是城市景观数据集,互为S、D;
  4. Domain-Specific Suppression for Adaptive Object Detection:从训练权重与梯度的角度出发讨论,网络为ResUnit相关,数据集中涉及域之间的天气差异(有没有雾)、相机设置差异、真实图像与合成图像间差异

关于Human Object Interaction(5篇)
有三篇都是基于transformer做的

  1. Affordance Transfer Learning for Human-Object Interaction Detection:检测时采用faster-RCNN结构
  2. Glance and Gaze: Inferring Action-aware Points for One-Stage Human-Object Interaction Detection:提出了一个 GGNet

显著性目标检测(3篇)

  1. Group Collaborative Learning for Co-Salient Object Detection:联合显著性目标检测
  2. Calibrated RGB-D Salient Object Detection:将图像RGB stream与深度stream分别编码
  3. Weakly Supervised Video Salient Object Detection:双向的ConvLSTM,弱监督,图像标注两笔,一笔画在显著性目标上一笔在背景上
  4. Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

少样本学习(9篇)
例:Dense Relation Distillation With Context-Aware Aggregation for Few-Shot Object Detection:少样本目标检测,框架基于元学习,处理检测中物体间遮挡、外观变化等问题;
Hallucination Improves Few-Shot Object Detection:网络结构有基于Faster-RCNN

关于Transformer(7篇)

  1. Adaptive Image Transformer for One-Shot Object Detection:使用patch作为query(未完);
  2. UP-DETR: Unsupervised Pre-Training for Object Detection With Transformers:使用patch作为query,从原始图像中查询这些random裁剪的patch(未完);
  3. HOTR: End-to-End Human-Object Interaction Detection With Transformers:从图像中直接推断三元组<human,object,interaction>,例如:<人,凳子,坐>;
  4. End-to-End Human Object Interaction Detection With HOI Transformer:也是关于人物交互的
  5. QPIC: Query-Based Pairwise Human-Object Interaction Detection With Image-Wide Contextual Information:也是关于人物交互的
  6. Open-Vocabulary Object Detection Using Captions:建立一个图像和文字标签的空间,建立空间的时候使用了transformer,使用边界框注释对有限的对象类别集进行训练
  7. Points As Queries: Weakly Semi-Supervised Object Detection by Points:改进的DETR

搜索(4篇)

  1. GAIA: A Transfer Learning System of Object Detection That Fits Your Needs:自动搜索合适的目标检测网络结构;
  2. Scale-Aware Automatic Augmentation for Object Detection:自动搜索合适的数据增强方式,关注scale的aug,从image-level与bbox-level去aug数据,例如image-level采用zoom-in zoom-out;
  3. OPANAS: One-Shot Path Aggregation Network Architecture Search for Object Detection:自动搜索网络结构用于目标检测(NARS)
  4. MobileDets: Searching for Object Detection Architectures for Mobile Accelerators:搜索移动端的目标检测网络结构

长尾问题(2篇)

  1. Equalization Loss v2: A New Gradient Balance Approach for Long-Tailed Object Detection:提出长尾目标检测问题在于正负梯度不平衡,提出了EQL_v2 loss用以平衡每个类别训练过程,模型采用了maskrcnn与Cascade
  2. Adaptive Class Suppression Loss for Long-Tail Object Detection:打破手工分组的局限性,设计了一种新的自适应类抑制损失(ACSL)算法,模型为Faster R-CNN with ResNet50-FPN backbone

关于生成对抗(2篇)

  1. Class-Aware Robust Adversarial Training for Object Detection:加入noisy扰动干扰检测
  2. Robust and Accurate Object Detection via Adversarial Learning:使用对抗方法robust检测器

另 一些各种各样角度的论文:

航空图像目标检测:
ReDet: A Rotation-equivariant Detector for Aerial Object Detection:关注旋转不变性特征

关于量化:
AQD: Towards Accurate Quantized Object Detection:保证精度的条件下在所有网络结构层使用纯整数进行推理,已应用于FCOS、RetinaNet

关于Attention
Dynamic Head: Unifying Object Detection Heads with Attentions:对目标检测任务检测头的注意力进行可视化(未完)

关于知识蒸馏:
General Instance Distillation for Object Detection

主动学习:
Multiple Instance Active Learning for Object Detection

Mutual Graph Learning for Camouflaged Object Detection:MGL将一幅图像解耦为两个特定于任务的特征映射——一个用于大致定位目标,另一个用于准确捕捉其边界细节——并通过图来反复推理它们的高阶关系,模型ResNet-FCN

Improved Handling of Motion Blur in Online Object Detection:关注运动模糊问题,模型结构沿用resnet50 FPN,faster-RCNN

Neural Auto-Exposure for High-Dynamic Range Object Detection:关于曝光图像等的目标检测(未完)

End-to-End Object Detection With Fully Convolutional Network:抛弃NMS,采用3D最大卷积,提出Prediction-aware One-To-One (POTO) label assignment(未完)

OTA: Optimal Transport Assignment for Object Detection(暂时没看懂)

Depth from Camera Motion and Object Detection:使用faster-RCNN为检测器,关于相机运动情况下的物体深度估计问题

Beyond Bounding-Box: Convex-hull Feature Adaptation for Oriented and Densely Packed Object Detection:可形变卷积,anchor free,利用点集形式而非bbox表示一个物体的轮廓(未完)

Towards Open World Object Detection:基于聚类和能量的模型

UniT: Unified Knowledge Transfer for Any-shot Object Detection and Segmentation:基于Faster-RCNN & Mask-RCNN,弱监督

Generalized Focal Loss V2: Learning Reliable Localization Quality Estimation for Dense Object Detection:focal loss的改进版,处理密集场景下的目标检测(未完)

Sparse R-CNN: End-to-End Object Detection with Learnable Proposals:提出了Sparse R-CNN(未完,这论文要细看)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CVPR 2021 Object Detection 的相关文章

  • [小技巧] git: Your branch and 'origin/master' have diverged

    本文参考 http stackoverflow com questions 19864934 git your branch and origin master have diverged how to throw away local c
  • mac os x excel 单元格换行

    参考 http jingyan baidu com article 0f5fb09911cb366d8334ea07 html Windows 下是 alt 回车 mac os x 下变成 alt ctrl 回车
  • Vue3通透教程【十四】TS其他类型详解(一)

    文章目录 写在前面 对象类型 函数结构类型 数组类型 元组 枚举 类型别名 写在最后 写在前面 专栏介绍 凉哥作为 Vue 的忠实 粉丝输出过大量的 Vue 文章 应粉丝要求开始更新 Vue3 的相关技术文章 Vue 框架目前的地位大家应该
  • 毕业设计 STM32的智能WIFI视频人脸追踪监控系统

    0 前言 这两年开始毕业设计和毕业答辩的要求和难度不断提升 传统的毕设题目缺少创新和亮点 往往达不到毕业答辩的要求 这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求 为了大家能够顺利以及最少的精力通过毕设 学长分享优质毕业设计项

随机推荐

  • 函数内变量的提升(function hoisting)

    1 函数内外有重名的变量时 局部变量会覆盖全局变量 原因是函数域优先于全局域 2 当js执行进入函数时 函数内部声明过的所有变量会被提到最前 但同时对变量的赋值等操作不会被提升 例 var a 123 function test alert
  • 12帧跑步动画分解图_今天给大家分享一个跑步动画教程和注意事项!希望有所帮助!...

    跑步的动画的制作 一 跑步的基本原理 前面介绍了走路的动画的制作 跑步的制作方式和走路的方式是一样的 但是我们怎样来区别这两个动作的不同呢 虽然跑步在日常生活中经常看见 但是我们可能从来没有仔细的分析每一个动作 现在我们再来简单的说一下走路
  • upload labs第二关

    从上往下 首先定义两个变量 其中一个为空 在点击提交按钮后 前提文件路径可以找到 开始看文件类型是否为jpeg png gif格式 is upload false msg null if isset POST submit if file
  • Docker搭建zookeeper

    问题背景 前言 本文参考自 docker compose快速搭建Zookeeper集群 熬到凌晨三点多验证部署成功 网上有很多文章已经无法正确部署了 因为有些东西版本升级了 版本跟不上就会报错 还有一种更加详细更加全面的部署方式 Docke
  • 新人如何快速高效的学习Java?

    如果是新人 不想通过培训班 想学java 那么我可以很认真的告诉你 如果你是因为兴趣学学 那么你怎么学都可以 建议你找一些零基础入门的视频来学习 先看一遍 认识一下Java是个什么东西 如果是想转行学习 靠这个来工作 那么你就要好好的制定一
  • 一台计算机要两个内网,局域网如何在一台电脑上设置两个IP地址

    由于工作原因 有时需要连接两个局域网 除了频繁地更换不同局域网的网线 还要不停地设置不同局域网的IP地址 真是很麻烦 下面是学习啦小编收集整理的局域网如何在一台电脑上设置两个IP地址 希望对大家有帮助 局域网在一台电脑上设置两个IP地址的方
  • STM32F4单片机ADC采样及ARM-DSP库的FFT

    模拟信号经过ADC采样后变成数字信号 数字信号可以进行FFT运算 在频域中更容易分析信号的特征 本文将介绍如何用STM32F4的进行ADC采样 并利用ARMDSP库里的FFT算法对ADC采样值进行快速傅里叶变换 我使用的是STM32F407
  • CUDA编程中内存管理机制

    GPU设备端存储器的主要分类和特点 大小 全局 Global 和纹理 Texture 内存 大小受RAM大小的限制 本地 local 内存 每个线程限制在16KB
  • windows平台中使用vscode远程连接linux进行c++开发配置教程(内容详细适合小白)-2021-3-30

    文章目录 一 简要介绍 二 软件安装步骤 1 linux系统安装 2 vscode安装 3 ssh安装 4 配置Remote SSH 5 安装远程插件 6 简单小测试 三 配置vscode开发环境 1 默认设置 用户设置 远程设置和工作区设
  • Qt 开发环境搭建

    Qt开发环境搭建 Qt下载 Qt安装 Windows平台 离线安装 在线安装 Qt安装目录 VS2019搭建Qt开发环境 安装扩展插件 Qt VS Tools Qt Versions配置 问题 VS2019双击编辑UI时闪退 qt显示中文乱
  • 区块链物品溯源系统

    文章目录 前言 一 区块链有哪些特点 二 区块链能给品牌或者行业带来什么 1 信任度 2 小程序展示 总结 前言 区块链是一个典型的分布式协同系统 多方共同维护一个不断增长的分布式数据记录 这些数据通过密码学技术保护内容和时序 使得任何一方
  • Qt multiple definition of (function)

    前景 做项目代码优化 将原来的代码按简单工厂模式进行重新组合编写 对整个模块的文件夹进行分类 归纳 中途 出现这一问题 问题详述 某一类中的全部函数都有error multiple definition of function name 解
  • Linux 下刷 TWRP

    安装 adb 和 fastboot apt install android tools adb android tools fastboot 下载需要的 TWRP https dl twrp me flo 开机状态下进入 bootloade
  • async_await用法

    async作为修饰关键字修饰在函数前 表示该函数是一个异步函数 await的使用必须有async关键字 await等待的必须是一个promise对象 async返回的是一个promise对象 asyn function A return 星
  • pthread_cond_destroy()函数的使用

    NAME pthread cond destroy pthread cond init destroy and initialize condition variables SYNOPSIS THR include
  • 像数组一样使用NodeList:一个对象组合的有效用法

    场景 我是用querySelectorAll 查询了一些标记 并收到了一个NodeList响应 问题 节点列表类似于数组 比如 他们都有一个长度属性 它们都在括号中的索引访问它们的属性或者子元素 NodeList 0 尝试使用 map fi
  • 最小二乘法–高斯牛顿迭代法

    最小二乘法 高斯牛顿迭代法 本文将详解最小二乘法的非线性拟合 高斯牛顿迭代法 1 原理 高斯 牛顿迭代法的基本思想是使用泰勒级数展开式去近似地代替非线性回归模型 然后通过多次迭代 多次修正回归系数 使回归系数不断逼近非线性回归模型的最佳回归
  • ELK收集docker日志

    转载来源 ELK收集docker日志 1 安装docker 安装依赖 yum install y yum utils device mapper persistent data lvm2 添加软件源 yum config manager a
  • 【简单】228. 汇总区间

    原题链接 https leetcode cn problems summary ranges description 228 汇总区间 给定一个 无重复元素 的 有序 整数数组 nums 返回 恰好覆盖数组中所有数字 的 最小有序 区间范围
  • CVPR 2021 Object Detection

    一 关于3D有26篇 3DIoUMatch Leveraging IoU Prediction for Semi Supervised 3D Object Detection ST3D Self Training for Unsupervi