【DA 03】Exploring Categorical Regularization for Domain Adaptive Object Detection (CVPR 2020)

2023-11-14

摘要

解决目标检测的域自适应问题,其中主要是source和target域之间的巨大差异。前人的工作主要在对齐image-level和Instance-level shifts(Bias 07:DA Faster RCNN),然而,他们忽略去了crucial image regions和important instances在不同域的匹配,这会导致domain shift效果变差。

本文提出一种categorical regularization framework来缓解该问题,并且作为一个plug-and-play,可以灵活的加在DA Faster R-CNN上。

具体来说,通过聚合一个image-level multi-label classifier(因为分类器有但是不强的定位能力)到detection backbone中,我们可以获得和分类信息相关的稀疏但是重要的图片区域。同时,在instance-level,通过在classifier和detection head之间引入一个regularization factor,去自动寻找目标域的hard aligned instances。

 

Introduction

domain adaptive在图像分类 [5, 6, 22, 33],语义分割 [13, 30, 32] 和目标检测 [1, 28, 41, 12]都有广泛的应用。在目标检测中,DA Faster RCNN是最具有代表性的工作。

近期,DA Faster RCNN有多个系列 [28, 41, 12, 14]。其中 [28, 41]观察到:纯图像级对齐强制对立不可转移的背景,而目标检测任务本质上是聚焦域可能包含感兴趣目标的局部区域。进一步,虽然instance-level对齐可以让object proposals在域上对齐,但是当前的尝试 [1, 12]缺少从low-value region proposals中识别hard aligned instances的能力。

简单来说,本文认为DA Faster RCNN在Image-level(classifier)上,可能只是将target domain大范围的背景,和soure domain强行对齐,而不是将crucial regions去对齐;在head detection上同理。

通过categorical regularization framework,我们可以让backbone networks可以在两个领域中更准确的激活兴趣区域,从而得到更好的自适应目标检测结果。

具体来说,本文包含两个regularization modules,image-level categorical regularization (ICR)和categorical consistency regularization(CCR)。

(1)ICR:在detection backbone network上添加image-level multi-label classifier,并且用source domain的类别标签有监督训练。(2)CCR:考虑image-level predictions和instance-level predictions之间的一致性。

 

Approach

Image-level Categorical Regularization

 对于给定的detection backbone network,本文对最后一个卷积层执行global average pooling,将池化后的特征宋玉一个multi-label classifier(通过一个1x1卷积),通过交叉熵多目标损失。

 

Categorical Consistency Regularization

本文设计CCR模块去自动寻找hard aligned instances,并基于以下两个动机:(1)因为存在大量的low-value背景候选框,导致无法找到target domain中的hard foreground instances。(2)image-level classifier和instance-level detection level是互补的,因为前者可以帮助RPN获得更准确的RoI特征。假设pjc代表第j个实例的类别为c

在instance-level adversarial loss的基础上扩展:

 得到最终的损失函数(DA-Faster):

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【DA 03】Exploring Categorical Regularization for Domain Adaptive Object Detection (CVPR 2020) 的相关文章

随机推荐

  • Nginx的概述和配置

    一 Nginx概述 1 Nginx的特点 2 Nginx编译安装 3 Nginx运行控制 4 Nginx和Apache的区别 4 1 nginx相对于apache的优点 4 2 apache相对于nginx的优点 二 编译安装Nginx服务
  • 解决ssh免密登录Enter passphrase for key问题

    该问题的出现是由于在生成秘钥过程 即ssh keygen t rsa P 后面的 P代表验证秘钥的密码 相当于第二层所 当不小心弄错了 就会让你输入这里的字符 解决方案 1 输入 P 后面需要输入的字符 2 删掉 ssh文件下的公钥和秘钥
  • android 使用OPENGL ES实现地月模型(3D)-纹理映射基础

    效果图 编写Dad java 在构造器中设置场景渲染器为主动渲染 并声明地球与月球的引用 在绘制changing方法中绘制地球 月球 浩瀚星空 通过线程控制地球 月亮的转动 创建纹理贴图 package com scout eeeeeee
  • Executors类中创建线程池的几种方法的分析

    Executors类中创建线程池的几种方法的分析 要配置一个线程池是比较复杂的 尤其是对于线程池的原理不是很清楚的情况下 很有可能配置的线程池不是较优的 因此在Executors类里面提供了一些静态工厂 生成一些常用的线程池 1 newFi
  • 2023备战金三银四,Python自动化软件测试面试宝典合集(五)

    接上篇 八 抓包与网络协议 8 1 抓包工具怎么用 我原来的公司对于抓包这块 在 App 的测试用得比较多 我们会使用 fiddler 抓取数据检查结果 定 位问题 测试安全 制造弱网环境 如 抓取数据通过查看请求数据 请求行 请求报头 请
  • HTML——label标签

    label标签 是什么 label标签是HTML中的一个标签 用于为表单元素 如文本框 复选框等 提供标签或说明文本 通常与input标签配合使用 label标签可以通过for属性与相应的表单元素建立联系 这样当用户点击标签时 相应的表单元
  • 三、Python基础(高级变量类型篇)

    三 Python基础 高级变量类型篇 目录 三 Python基础 高级变量类型篇 一 列表 list 1 列表的定义 2 列表的常用方法和操作 对象 方法名 参数 3 for in对列表迭代遍历 4 利用 for in 的输出技巧 5 se
  • CPU占用100%的一般原因及解决办法

    转自 微点阅读 https www weidianyuedu com content 2517683835639 html 电脑关机故障速解 经常出现cPU占用100 的情况 主要问题可能发生在下面的某些方面 cPU占用率高的九种可能 1
  • 有奖调研

    历经五载 FISCO BCOS开源联盟链生态圈已汇聚超过3000家机构与企业 7万多名个人成员 大家秉持共建共享的开源精神 一同建设出FISCO BCOS在技术 应用和生态上的累累硕果 在这片天地里 我们与志同道合的伙伴交流技术 也发现了区
  • 关于类,你真的掌握了吗?(详细代码解读以及详细图解)

    目录 一 类和对象 二 类和类的实例化 三 类的成员 四 封装 五 构造方法 六 代码块 今日良言 既然选择了远方 便只顾风雨兼程 一 类和对象 1 类 具有相同特性 属性 和行为的对象的抽象 类是一个模板 2 对象 对象是人们要进行研究的
  • 多元线性回归方差分析表理解

    1 单因素一元方差分析的方法和案例 例子 案例的代码 X 533 580 525 600 570 650 500 因数I A F 实验组 CK标准 565 600 500 615 575 661 510 525 575 510 590 56
  • 四个视角,讲透额温枪应用设计中的运放问题

    3 月 12 号 世界卫生组织宣布新冠肺炎为全球性流行病 抗疫正从中国的 人民战争 变成一场 世界大战 很多事情正在微妙和快速的变化 额温枪和口罩一样 成为抗疫以及复产复工必不可少的日常用品 额温枪成了市场上炙手可热的产品 很多厂家开始步入
  • Top n 开源物理仿真引擎

    物理仿真引擎可以做为强化学习用 也可以做游戏等 列举主要几个开源的 pybullet Webots 开源早的 用户也多 比如 pybullet提供Python API 学习曲线较平缓 Nvidia的isaac 新开源不久 GPU支持好 Mu
  • 微信能上但浏览器无法上网

    微信能上但浏览器无法上网 问题描述 微信能聊天传文件 但是浏览器一直显示 未链接到互联网 问题描述 网络诊断提示 远程计算机或设备将不接受链接 出现这类问题 一般都是电脑打开了SSR代理服务 关闭了代理服务基本上就可以恢复正常上网了 解决方
  • Unity的C#编程教程_47_函数和方法

    C Functions and Methods Overview 1 Functions vs Methods 函数和方法其实就是一个东西 在 C 中通常称之为方法 方法 就是一块打包的代码 比如我们最常见的 就是在 Unity 中初始化
  • Mac git 命令自动提示

    1 首先安装配置Homebrew 注 如果已经安装过就跳过 在终端输入如下命令 usr bin ruby e curl fsSL https raw githubusercontent com Homebrew install master
  • 【GitLab】docker部署个人代码私服(开源gitlab)

    文章目录 前期准备 安装部署 拉取Gitlab镜像文件 创建容器挂在卷轴目录 运行镜像 修改配置文件 重启容器 使用说明 初次登陆 更改语言模式 创建新用户 邮件转发服务 总结 前期准备 准备一台CentOS7 8 以上版本的服务器 标配2
  • 编程题目:求二叉树的叶子结点个数(涉及前中序遍历,建树,叶子节点个数)

    以二叉链表作为二叉树的存储结构 求二叉树的叶子结点个数 输入格式 输入二叉树的先序序列 提示 一棵二叉树的先序序列是一个字符串 若字符是 表示该二叉树是空树 否则该字符是相应结点的数据元素 输出格式 输出有两行 第一行是二叉树的中序遍历序列
  • 关注深度学习代码

  • 【DA 03】Exploring Categorical Regularization for Domain Adaptive Object Detection (CVPR 2020)

    摘要 解决目标检测的域自适应问题 其中主要是source和target域之间的巨大差异 前人的工作主要在对齐image level和Instance level shifts Bias 07 DA Faster RCNN 然而 他们忽略去了