Unsupervised Data Augmentation For Consistency Training 论文阅读

2023-05-16

Unsupervised Data Augmentation For Consistency Training 论文阅读

UDA这篇文章针对的是半监督学习中无标签数据的增强，论文提出，使用有标签数据的data agumentation方法，也能有效的应用于无标签数据的增强中。论文在文本分类和图像分类问题上进行了实验对比。

这是半监督训练的流程图，左侧是有标签数据，右侧是无标签数据。可以看出有标签数据的做法和普通做法没什么区别，而无标签数据采用的一种叫一致性训练的思想（不是这篇论文的成果）：首先对无标签数据做一个增强，然后将增强前的数据和增强后的数据都送进网络，出一个预测结果，将这两个结果算一个KL散度作为无监督的loss，和有监督的loss加在一起做BP。目标函数就是这个样子：

min ⁡ θ J ( θ ) = E x , y ∗ ∈ L [ − log ⁡ p θ ( y ∗ ∣ x ) ] + λ E x ∈ U E x ^ ∼ q ( x ^ ∣ x ) [ D K L ( p θ ~ ( y ∣ x ) ∥ p θ ( y ∣ x ^ ) ) ) ] \left.\min _{\theta} \mathcal{J}(\theta)=\mathbb{E}_{x, y^{*} \in L}\left[-\log p_{\theta}\left(y^{*} | x\right)\right]+\lambda \mathbb{E}_{x \in U} \mathbb{E}_{\hat{x} \sim q(\hat{x} | x)}\left[\mathcal{D}_{\mathrm{KL}}\left(p_{\tilde{\theta}}(y | x) \| p_{\theta}(y | \hat{x})\right)\right)\right] minθJ(θ)=Ex,y∗∈L[−logpθ(y∗∣x)]+λEx∈UEx^∼q(x^∣x)[DKL(pθ~(y∣x)∥pθ(y∣x^)))]

前一项就是有标签的loss，后一项就是无标签的loss， λ \lambda λ表示两者之间的比例。这里面有一个训练时的trick，在做BP时，无标签那边未增强数据那一条支路（也就是x那一路）是BP阻断的，就是反向传播不计算也不使用那里的梯度（但不是不更新M），事实上确实挺有用的（因为一开始我没阻断…)

本文关注的问题是，用什么样的方法来做无标签数据的增强，训练的效果好呢？本文得出的结论是，用在有标签数据上增强效果好的方法，用在无标签数据上也好，因此就挑了三种在有标签数据增强上表现好的方法来做实验。文本相关的我不懂，这个RandAugment(RA)是做图像增强的，是从一个叫AutoAugment的方法简化过来的。RA增强时，每次使用两种数据增强方法，是从PIL中选出来的15种中随机抽两种(可以重复)。这两种方法，每种方法都有50%的概率会被执行(或者以另一种方式执行，比如旋转可以是正度数也可以是负度数)，还有一个magnitude参数来描述具体的执行程度(比如旋转可以转0°~60°，magnitude用来确定具体旋转多少度)。论文还使用了一个16x16的mask，来随机遮盖(涂黑)cifar10(32*32)上的一个区块。论文在附录还给了一个研究成果，大概是每次做十种增强，训练出来的效果最好。

论文中使用了自己提出的TSA(Training Signal Annealing)，来防止有标签数据过拟合。具体来说，如果一个有标签数据的预测概率超过了当前阈值，那么在这次计算loss时就不算它的了(因为它已经表现很好了，再训练也不过是过拟合而已)。如下图，针对容易/一般/不易过拟合三种情况，阈值曲线分别是指数型/线性型/对数型，来影响拟合的速度。

实际上，半监督的研究我是做不起的，看后面的训练参数就知道做不到。就拿Cifar10来说，论文训练了400k个step，有监督数据batchsize64，无监督数据batchsize320，如果有监督数据取4k(论文的某一个实验)，这玩意要跑6.4k个epoch，我一个epoch就要8分钟(当然，实现上有点差别)，没设备是真的不行…以后不做这种自己根本不可能做的研究和复现了…

我的复现实现细节上有些差别，我用了5k个有监督数据，有监督数据batchsize32，无监督数据batchsize288，刚好一个epoch每个图片用一次。我一共只训练了15k个step，100个epoch，学习率论文是从0.03到0.004余弦下降， λ \lambda λ取1。我是从0.004开始每30个epoch降到1/2， λ \lambda λ取10。这样子训练出来也就那样…我也不想折腾它了，还是干点能干的吧。代码挂在GITHUB上：https://github.com/cyfwry/UDA-repo-pytorch
以上是我一周前的想法，后来我去自己写了个ESPCN来训练，结果也做不出来…折腾了一周了…我想我可能确实不适合DL这个领域，也许应该转行了吧…

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Unsupervised Data Augmentation For Consistency Training 论文阅读的相关文章

【python】pyinstaller使用 --add-data --add-binary打包额外资源

为什么要使用 add data 程序里文件格式有很多种 xff1a 源代码 py 图片格式 png jpg ico 等配置文件 ini json xml等其他可执行文件 bin exe等模型文件 pth 等说明文档 txt md等
将sql文件导入数据库时，报错Data truncated for column

解决办法打开my span class token operator span ini配置文件将sql model中的 span class token constant STRICT TRANS TABLES span 去掉
VTK6.3.0 error: no override found for 'vtkPolyDataMapper'

1 开发环境计算机系统 Win7 Qt版本 5 4 0 Qt Creator版本 3 0 1 VTK版本 6 3 0 编译器 VS2013 2 解决方法1 根据参考资料 1 的说明 xff0c 在源程序中添加头文件 cpp view pl
Qt for iOS，Qt 与Objective C混合编程

因为我写了一系列Qt的博文以及一本书 Qt on Android核心编程 xff0c 最近有好几个使用Qt的朋友问起 Qt for iOS 的事情 xff0c 因为我在这方面的经验特别少 xff0c 写不出系统的文章来 xff0c 非常抱歉
解决：No converter for [xxxx] with preset Content-Type ‘text/plain；version=0.0.4；charset=utf-8‘

文章目录项目背景问题描述问题分析解决方案方案一 xff1a 修改Controller定义方案二 xff1a 修改Controller返回值方案三 xff1a 全局处理项目背景 Spring Boot 2 X 问题描述错误信息如下 xf
Unable to resolve service for type 'Microsoft.Extensions.Logging.ILogger' while attempting to activa...

Unable to resolve service for type 39 Microsoft Extensions Logging ILogger 39 while attempting to activate 39 xxxxx Cont
webpack One CLI for webpack must be installed. These are recommended choices, delivered as separate

场景安装webpack的时候遇到的情况直接按照提示安装提示Module webpack cli 不存在 One CLI for webpack must be installed These are recommended choi
Multipart/form-data POST文件上传详解

理论简单的HTTP POST 大家通过HTTP向服务器发送POST请求提交数据 xff0c 都是通过form表达提交的 xff0c 代码如下 lt form method 61 34 post 34 action 61 34 http w
twemproxy for redis使用说明及简单分析

redis的数据量在内存高过50G时系统出现了明显的瓶颈为了解决这个问题 xff0c 笔者找了些相关的资料 xff0c 发现了这个开源软件功能很强大 xff0c 包含了last fm的ketama的一致性hash算法 xff0c 对于笔
iptables - administration tools for packet filtering and NAT

2 iptables administration tools for packet filtering and NAT Linux Iptables Manual Incoming Traffic V 43 43 PREROUTING 4
翻译-Frustum PointNets for 3D Object Detection from RGB-D Data

Frustum PointNets for 3D Object Detection from RGB D Data 摘要介绍相关工作从RGB D数据中检测三维物体基于前视图图像的方法 xff1a 基于鸟瞰图的方法基于3D的方法点云的深度
A review of visual SLAM methods for autonomous driving vehicles

自主驾驶车辆的视觉SLAM方法回顾原论文在文章末尾摘要 xff1a 自主驾驶车辆在不同的驾驶环境中都需要精确的定位和测绘解决方案在这种情况下 xff0c 同步定位和测绘 xff08 SLAM xff09 技术是一个很好的研究解决方案
Vue：子组件使用的细节，子组件中的data，ref的使用，

我们创建一个table div table tbody tbody table div
splunk之获取数据（Ingesting Data）

Ingesting Data 下载数据地址 http splk it f1data use uname in the Username field and 5p1unkbcup for the Password field
Python语法：... for ... in ... if ...

Python中 for in if 语句是一种简洁的构建List的方法从for给定的List中选择出满足if条件的元素组成新的List 其中if是可以省略的下面举几个简单的例子进行说明 for in for in 语句实例如下 1 a
Python：使用循环语句for 做一个九九乘法表

学会了循环语句后就能做很多小程序了在这里演示几种九九乘法表的编程方法首先使用for循环来进行编程 for hang in range 1 10 定义行为hang 行数为9 for lie in range 1 hang 1 定义列为l
教妹学Java(十五)：for循环详解

你好呀我是沉默王二一枚颜值与才华俱在的程序员本篇教程通过我和三妹对话的形式来谈一谈 for while do while 循环之间的差别以及重点介绍一下 for 循环 while do while 会在接下来的教程中单独介绍教妹学
vue中computed的属性对data中的属性赋值为undefined的原因

场景我在computed中return了一个值然后在data中直接将它复制给另一个属性结果data中的属性值为undefined 代码示例 timer为undefined 原因在这里很容易想到是执行顺序的问题 computed中的属
顺序一致但非静态一致的执行示例

根据 Maurice Herlihy 和 Nir Shavit 的多处理器编程的艺术第 3 章在并发程序的正确性方面顺序一致性是比静态一致性更强的条件作者还在 3 4 1 中提到存在顺序一致的执行但并非静态一致我不明白怎么办
如何保持长时间运行的NHibernate Session数据一致？

我在 ASP NET 会话中缓存了 NHibernate 会话我遇到过一种情况用户编辑了一个对象因此它位于 ISession 的第一级缓存中然后另一个用户编辑了同一个对象此时用户 1 仍然可以看到其编辑的原始版本而用户 2 可

随机推荐

centos7安装FreeSwitch，以及设置Freeswitch开机自启

一下载指定版本的freeswitch cd usr local src git clone branch v1 10 7 https github com signalwire freeswitch git 也可以下载1 10 7的压缩包
[iOS] TableViewCell 自适应高度

说明 TableViewCell 几乎是必用控件 xff0c 使用 TableViewCell 免不了计算其 cell 高度 xff0c 网上也有非常多关于 TableViewCell 高度自适应的文章 xff0c 自己也尝试总结了计算ce
Tmux 使用教程

转载自Tmux 使用教程作者 xff1a 阮一峰 URL xff1a http www ruanyifeng com blog 2019 10 tmux html Tmux 1 Tmux 是什么 xff1f 1 1 会话与进程1 2 Tm
MacOS 下 VScode 编译运行 C/C++ （ACM向）简单粗暴

VSCode 的下载安装在 VSCode 官网点击 Download for Mac 开始下载 xff0c 之后双击下载完成的文件等待一会就安装好了必备插件安装 VSCode 启动后 xff0c 点击左侧最下的方块形按钮 xff08
写在2019年ACM-ICPC亚洲区域赛宁夏站之后——一只菜鸡的ACM生涯

写在2019年ACM ICPC亚洲区域赛宁夏站之后一只菜鸡的ACM生涯一晃时间就过去了 xff0c 接触ACM也将近一年半的时间在这段时间里 xff0c 有过找不出来bug的难受体验 xff0c 也有过茅塞顿开的兴奋激动 xff1b
win10下安装Anaconda3后cmd中运行“conda”命令显示“‘conda’不是内部或外部命令，也不是可运行的程序”的解决方法

找到安装目录 Anaconda3 xff0c 例如我的是 C Users zuoyu Anaconda3 xff1b 将 Anaconda3 Anaconda3 Scripts Anaconda3 Library bin 三个目录添加到系统
VS Code中使用Code Runner运行Python代码时中文乱码问题解决

在配置文件 setting json 中加入如下代码即可 34 code runner executorMap 34 34 python 34 34 set PYTHONIOENCODING 61 utf8 amp amp python u
【PAT】B1019 数字黑洞

给定任一个各位数字不完全相同的 4 位正整数 xff0c 如果我们先把 4 个数字按非递增排序 xff0c 再按非递减排序 xff0c 然后用第 1 个数字减第 2 个数字 xff0c 将得到一个新的数字一直重复这样做 xff0c 我们很
【PAT】B1030 完美数列

给定一个正整数数列 xff0c 和正整数 p xff0c 设这个数列中的最大值是 M xff0c 最小值是 m xff0c 如果 M mp xff0c 则称这个数列是完美数列现在给定参数 p 和一些正整数 xff0c 请你从中选择尽可能多
【PAT】B1025 反转链表

给定一个常数 K 以及一个单链表 L xff0c 请编写程序将 L 中每 K 个结点反转例如 xff1a 给定 L 为 1 2 3 4 5 6 xff0c K 为 3 xff0c 则输出应该为 3 2 1 6 5 4 xff1b 如果 K
jupyter notebook中安装完nb_conda后，change kernel中仍然没有所需环境

问题前解 xff1a jupyter notebook创建新的环境时遇到困难解决笔记没有所需环境 xff0c 但按上述解决方案解决过问题解决方案 xff1a 需要增加kernel xff1a python m ipykernel ins
使用Code:Blocks调试程序

首先 xff0c 工程路径必须是英文 xff0c 不然根本打不开Debug模式鼠标停留在debug栏按钮上会显示名称将光标移至代码开始行 xff08 自定 xff0c 如程序有scanf xff0c 建议移至scanf下一行 xff09
对string类型sort

algorithm算法库里的sort函数超级好用 xff0c 那么怎么将string类型当成字符数组一样进行排序呢只要将需要排序的string的首尾地址放入就行啦也可以用自己写的cmp函数当成排序规则传参就可以 include lt
BFS算法求迷宫的最短路径

BFS Breadth First Search 算法的具体实现就是 xff1a 通过不断取得某个状态能够达到的所有状态并将其加入队列尾 xff0c 并且由于队列本身的特性先加入队列的状态总是先得到处理 xff0c 这样就可以总是先将需要转
JS Uncaught DOMException: Blocked a frame with origin “XXX“ from accessing a cross-origin frame问题解决

问题描述 xff1a Uncaught DOMException Blocked a frame with origin 34 http localhost 46819 34 from accessing a cross origin fr
Windows 正在连接xxx...无法打开到主机的连接。在端口xxx：连接失败问题解决

问题描述 xff1a 正在连接10 10 13 206 无法打开到主机的连接在端口8146 xff1a 连接失败问题分析 xff1a 1 使用telnet命令连接主机时 xff0c 主机的8146端口没有对外开放解决办法 xff1a
常用命令

1 xff1a gammping地图保存命令 rosrun map server map saver span class token operator span f your map 2 xff1a 进入功能包和查看列表 roscd am
%time与%timeit

time timeit 要在ipython下才可以使用 xff08 所以说Jupyter Notebook当然是可以用的 xff0c pycharm里的python环境也是jupyter Notebook的 xff09 time可以测量一行
pytorch加载与修改预训练模型

pytorch加载与修改预训练模型有时会希望用预训练的模型来fine tune或是作为初始化 xff08 毕竟初始化权重真的玄学 xff09 xff0c 但是不需要其中某一些层 xff0c 这时候就需要对加载的预训练模型做一些修改如果已
Unsupervised Data Augmentation For Consistency Training 论文阅读

Unsupervised Data Augmentation For Consistency Training 论文阅读 UDA这篇文章针对的是半监督学习中无标签数据的增强 xff0c 论文提出 xff0c 使用有标签数据的data agu

Unsupervised Data Augmentation For Consistency Training 论文阅读

Unsupervised Data Augmentation For Consistency Training 论文阅读

Unsupervised Data Augmentation For Consistency Training 论文阅读 的相关文章

随机推荐

热门标签

Unsupervised Data Augmentation For Consistency Training 论文阅读的相关文章