半监督目标检测(三)

2023-10-28

目录

ISMT

动机

1. Overview

2. Pseudo Labels Fusion

3. Interactive Self-Training

4. Mean Teacher

Unbiased Teacher

动机

1. Overview

2. Burn-In

3. Teacher-Student Mutual Learning

4. Bias in Pseudo-Label


ISMT

Interactive Self-Training with Mean Teachers for Semi-supervised Object Detection

动机

1. 此前 semi-supervised object detection (SSOD) 的方法都忽略了一个问题:对于同一张图像,不同的训练迭代次数所产生的检测结果存在差异;

2. 不同的模型对同一张图像的检测结果不同。

5097c75e5281425f928955493d0656d4.png

1. Overview

为改善上述问题,作者提出 interactive self-training with mean teachers (ISMT):

10c3020f42134087b984caebfb70519e.png

首先,作者使用带标签数据预训练监督模型(拥有两个检测头部 ROI Heads 的 Faster R-CNN),并利用这个预训练模型在无标签数据上生成原始的伪标签,以此为基础构成 Pseudo Labels Memory。

在半监督训练阶段,作者用预训练参数初始化模型,并将带标签数据和无标签数据共同输入训练模型。对于带标注数据,损失函数与监督学习相同。而对于未标注数据,作者采用 ISTM 方法。即利用 Pseudo Labels Memory 和非极大值抑制(NMS)融合不同迭代次数产生的检测结果。此外,对于两个不同结构的 ROI Heads 使用 mean teacher 方法,每一个 teacher ROI head 由相应的 student ROI head 使用指数移动平均(EMA)得到,并且为当前 batch 的未标注数据生成最新的检测结果。然后,使用 NMS 将该检测结果与 Pseudo Labels Memory 中同一张图片的相应历史伪标注融合,得到最终的伪标签。对于每一个 student ROI head,使用的伪标签分别融合自另一个 teacher head。

最终损失函数如下:

ddc0bda784954f4cb4978c4564a8784d.png

其中,γ 为非监督损失的权重。

2. Pseudo Labels Fusion

为解决不同训练迭代次数产生的检测结果不稳定的问题,作者设置了 Pseudo Labels Memory 存储历史伪标签,使用 NMS 将历史伪标注与最新的检测结果进行融合和更新。

c5db793b46a24db296b5aef147876260.png

 e24ecf3dfe0f43e0903c9c5fe642ba73.png

3. Interactive Self-Training

为缓解 self-training 可能产生的过拟合问题,作者首先使用带标签的数据训练带有两个不同结构 ROI Heads 的检测模型,之后再分别用它们在无标签数据上生成伪标签。两个 ROI Heads 可以互相为对方提供有用的互补信息。

另外,作者使用 DropBlock 模块确保不同的 ROI Head 能够获得不同的关键信息,增加两个 ROI Heads 检测结果的差异性。

3986c0ed134b4a3ca678a685cce5389e.png

4. Mean Teacher

为了避免两个 ROI Heads 互相模仿,从而无法独立收敛,同时也为了保证产生的伪标签的稳定性,作者引入了 mean teacher 方法,即教师参数是相应学生参数的移动平均。

9f609ba183d54618a4961d0972edbb93.png

2b509e9898c34c39b4fd63680578a747.png

如上图,“Teacher ROI Head 1” 是 “Student ROI Head 1” 的指数移动平均(EMA),它为“Student ROI Head 2” 提供伪标签;随后,最新的检测结果将与历史伪标注融合。

Unbiased Teacher

Unbiased Teacher for Semi-Supervised Object Detection

动机

针对此前的半监督目标检测(SSOD)任务,作者主要关注的问题是:

目标检测领域所固有的类别不平衡问题,使得在半监督学习(SSL)情境下训练出的模型做出的预测往往是 biased,而 SSOD 领域普遍采用的伪标签方法进一步加剧了这一问题;此外,在标签数据不足时,目标检测任务往往存在严重的过拟合问题,如 RPN 前景和背景的分类,ROIhead 的多类别分类(不包括预测框回归)。

1. Overview

6283d3cbef9646aa99267d08516710a7.png

与此前的 SSOD 模型相似,Unbiased Teacher 也使用带 FPN 的 Faster R-CNN,以 Res-Net50 作为主干网络。

模型主要分为两个阶段:

1) Burn-In Stage

使用监督数据进行预训练,初始化模型。

2)Teacher-Student Mutual Learning Stage

使用教师-学生训练模式,首先将初始化参数分别复制给教师模型和学生模型。

Student Learning:利用教师模型生成伪标签,在此基础上训练学生。教师模型的数据采用弱增广,学生模型的数据采用强增广;

Teacher Refinement:使用学生模型参数的指数移动平均(EMA)更新教师模型,稳定地提升伪标签质量。

2. Burn-In

使用带标签数据对模型进行预训练。

86480b6603094cc0b5ff953d1e163d0d.png

3. Teacher-Student Mutual Learning

作者使用的是比较典型的 mean teacher 方法,即采用教师-学生模型共同训练的方式,以及强-弱增广方法,弱增广数据(random horizontal flip)输入教师模型用于生成伪标签,强增广(randomly add color jittering, grayscale, Gaussian blur, and cutout patches)用于训练学生模型。在此基础上,使用学生模型参数的 EMA 更新教师模型,以稳定提升伪标签质量。

比较不同的是,作者认为用以筛选伪标签的置信度阈值只与预测目标的分类有关,而与预测框位置的质量无关,所以作者不对无标签数据计算预测框回归损失,只计算分类损失

3e06992106e94553a828f7bf88429da1.png

9e8255e030a14c0996d7be18ddc2c6fe.png

4. Bias in Pseudo-Label

为解决 SSOD 存在的类别不平衡问题,作者将 交叉熵损失 替换为 多类别 Focal Loss,用于优化 ROIhead 的分类损失,使得模型可以专注于稀有类别和难例样本。

此外,作者认为, EMA 训练所具有的 “conservative property” 也有助于改善类别不平衡问题:

82714052bb1044cbbb023db2f7b533ec.png

参考资料:半监督目标检测(Semi-Supervised Object Detection,SSOD)相关方法介绍 - 知乎

半监督目标检测研究进展 - 知乎

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

半监督目标检测(三) 的相关文章

随机推荐

  • Redis系列之事务

    前言 Redis的事务其实是有事务一说的 但是Redis的事务其实又不能完全意义上称为事务 它其实是一种比较弱的事务 甚至可以理解为他是一种批量提交操作 今天我们来简单认识下什么是Redis的事务吧 什么是Redis的事务 Redis的事务
  • leetcode 周赛(hard),使所有区间的异或结果为零(js实现)

    给你一个整数数组 nums 和一个整数 k 区间 left right left lt right 的 异或结果 是对下标位于 left 和 right 包括 left 和 right 之间所有元素进行 XOR 运算的结果 nums lef
  • 华为OD机试真题- 上班之路【2023】【JAVA、Python、C++】

    题目描述 Jungle生活在美丽的蓝鲸城 大马路都是方方正正 但是每天马路的封闭情况都不一样 地图由以下元素组成 1 空地 可以达到 2 路障 不可达到 3 S Jungle的家 4 T 公司 其中我们会限制Jungle拐弯的次数 同时Ju
  • NLP扎实基础4:FastText模型与Pytorch复现

    FastText 论文 Joulin Armand et al Bag of tricks for efficient text classification arXiv preprint arXiv 1607 01759 2016 Fas
  • WEB常见的攻击方式有哪些?如何防御?

    一 什么是web攻击 Web攻击 WebAttack 是针对用户上网行为或网站服务器等设备进行攻击的行为 如植入恶意代码 修改网站权限 获取网站用户隐私信息等等 Web应用程序的安全性是任何基于Web业务的重要组成部分 确保Web应用程序安
  • grep常用方法

    grep常用方法 grep常用参数 grep匹配多个关键字 0 grep高亮 1 grep 字符串 2 反向匹配grep v 字符串 不包括 grep 本身 3 grep E 同时匹配多个关键字 或 关系 grep过滤空白行和注释行 4 同
  • 软件工程期末复习汇总(非常详细)

    期末复习 文章目录 期末复习 第1章 概论 软件过程模型 瀑布模型 演化模型 增量模型 原型模型 螺旋模型 喷泉模型 基于构件的开发模型 形式方法模型 第2章 系统工程 可行性分析 经济可行性 技术可行性 法律可行性 第3章 需求工程 需求
  • linux 下进程间通讯: 共享文件

    共享文件算是比较传统的进程间数据交换的一种方式 但是由于涉及到不同进程间反复文件I O 难免显得有些效率低下 共享文件的本质 实际是就是某个进程向共享为念写入数据 一个或多个进程从文件中读取数据 有可能涉及到进程之间资源竞争的问题 这里就涉
  • 【使用教程】一体化伺服电机在使能状态下如何切换模式

    PMM一体化伺服电机是一种集成了控制器 驱动器 编码器和伺服电机的设备 在使能状态下 电机进入 工作状态 在此状态下切换模式可以改变电机的运行方式 本文将介绍PMM一体化伺服电机在使能状态下如何切换模式 首先 我们需要了解PMM一体化伺服电
  • yolov2详细讲解

    yolov2详细讲解 概述 YOLO v1虽然检测速度快 但在定位方面不够准确 并且召回率较低 为了提升定位准确度 改善召回率 yolov2在yolov1的基础上提出了几种改进策略 如下图所示 一些改进方法能有效提高模型的mAP 改进方法介
  • java注解与反射

    一 注解Annotation 什么是注解 从jdk1 5之后 java增加对元数据 描述数据的数据 的支持 就是注解 注解可以再程序编译 类加载 运行时被读取 并执行相依的操作 注解 Annotation 它可以声明在包 类 字段 方法 局
  • Linux 环境部署 Nexus 服务

    一 私服是什么 一个特殊的远程仓库 它是架设在局域网内的仓库服务 供局域网内的开发人员使用 当Maven需要下载构建的使用 它先从私服请求 如果私服上没有的话 则从外部的远程仓库下载 然后缓存在私服上 再为Maven的下载请求提供服务 环境
  • 【满分】【华为OD机试真题2023 JS】狼羊过河

    华为OD机试真题 2023年度机试题库全覆盖 刷题指南点这里 狼羊过河 时间限制 1s 空间限制 256MB 限定语言 不限 题目描述 一农夫带着m只羊 n只狼过河 农夫有一条可载x只狼 羊的船 农夫在时或者羊的数量大于狼时 狼不会攻击羊
  • 剪映电脑版详细使用教程,让视频剪辑变得更简单了

    这几天关于剪映电脑版的消息非常多 相比于专业成熟的视频剪辑软件 但大家对这款剪映似乎特别感兴趣 小编也抽时间简单使用了一下 相比于adobe Premiere 和达芬奇来说 真的特别简单上手 结合了手机版的触摸与鼠标操作 新手也能简单上手了
  • 软件测试主要考点梳理以及真题讲解(附答案)

    需要题目答案及相关复习资料关注后留言私信即可 白驹过隙 转眼大学三年就过去了 软件测试与维护也成为大学中最后一门考试的科目 接下来为大家总结一下软件测试与维护考试的主要内容 题型 以及真题答案 一 题型 题型仅限于我们学校 SCUT 其他学
  • EDA12--DC脚本命令(一)

    这里写目录标题 一 流程简介 二 启动DC 三 读入与链接 3 1 analyze elaborate 3 1 1 analyze命令 3 1 2 elaborate命令 3 2 read命令 四 工作环境设置 4 1 设置工作条件 4 2
  • STM32——PWM(呼吸灯&舵机使用)

    目录 1 与pwm相关的函数介绍 1 1 输出比较函数配置 1 1 1 以下四个函数是配置图1中的四个比较单元 1 1 2 输出结构体赋默认值 1 2 单独修改参数的相关函数 1 2 1 单独设置极性相关函数 1 2 2 单独修改输出使能参
  • 数字图像处理领域的二十四个典型算法

    转自 http blog csdn net v JULY v article details 6210124 作者 July 二零一一年二月二十六日 参考 百度百科 维基百科 vc数字图像处理 数字图像处理领域的二十四个典型算法及vc实现
  • 计算机中丢失MSVCR120.dll,电脑找不到MSVCR120.dll怎么办

    在电脑打开浏览器后在顶部栏目搜索或许点击这里传送门 dll修复程序 site 按下回车键然后进入下载msvcp120 dll系统文件 1 然后再打开解压好的文件 打开后点击开始安装电脑丢失的msvcp120 dll文件 2 开始快速的进行相
  • 半监督目标检测(三)

    目录 ISMT 动机 1 Overview 2 Pseudo Labels Fusion 3 Interactive Self Training 4 Mean Teacher Unbiased Teacher 动机 1 Overview 2