对抗训练

2023-05-16

文章目录

- 1、定义
- 2、对抗训练：从CV到NLP
- - 2.1 CV中的数据格式
  - 2.2 NLP中数据格式
- ３、对抗样本与数据增强样本
- ４如何确定微小扰动
- - ４.1 Fast Gradient Sign Method(FGSM)
  - ４.2 Fast Gradient Method(FGM)
  - 4.3 Projected Gradient Descent(PGD)
- 5 实验结果
- 6 实现
- - 6.1 pytorch实现[2]
  - 6.2 keras实现[3]

1、定义

对抗样本：对输入增加微小扰动得到的样本。旨在增加模型损失。

对抗训练：训练模型去区分样例是真实样例还是对抗样本的过程。对抗训练不仅可以提升模型对对抗样本的防御能力，还能提升对原始样本的泛化能力。
在这里插入图片描述

2、对抗训练：从CV到NLP

对抗训练最初在cv中使用，nlp中很少使用。因为图像和文本的数据格式导致，在文本中无法增加微小扰动。同数据增强一样，cv中很适用，但nlp中的很少使用。

2.1 CV中的数据格式

图像是由矩阵表示的，如RGB图像是0~255的数字矩阵表示。

图像+微小扰动=图像

在这里插入图片描述

2.2 NLP中数据格式

文本会首先设置词表，然后将词映射为对应的索引：

文本+微小扰动≠文本

在这里插入图片描述
Goodfellow在17年[2]提出可以在embedding上做扰动。这样做会带来问题：在embedding扰动得到的“对抗样本”不能map到某个单词。在对抗攻击时，不能通过修改原始输入得到这样的样本。所以nlp中的对抗训练不能用于对抗攻击，只能用来提高模型泛化能力。

３、对抗样本与数据增强样本

提高模型的泛化性能是机器学习致力追求的目标之一。常见的提高泛化性的方法主要有两种：

添加噪声，比如往输入添加高斯噪声、中间层增加Dropout以及近来比较热门的对抗训练等，对图像进行随机平移缩放等数据扩增手段某种意义上也属于此列；
是往loss里边添加正则项，比如L1,L2惩罚、梯度惩罚等

数据增强与对抗样本都属于在原始输入引入噪声的方法。区别在于数据增强的噪声通常是随机的，而对抗样本的噪声是有目的性的。

在这里插入图片描述

随机噪声的实现方式简单，对泛化性的提升也确实有效。但他的一个明显缺点是“特异性”。随机噪声可能不会对模型造成明显干扰，所以对泛化性能提升帮助有限。

４如何确定微小扰动

对抗训练流程，在原始输入上增加一个微小的扰动 r a d v r_{adv} radv，得到对抗样本，用对抗样本就行训练。可以抽象为下面的模型：
l o s s = − l o g p ( y ∣ x + r a d v ; θ ) w h e r e r a d v = − a r g m a x r , ∣ ∣ r ∣ ∣ < ε l o g p ( y ∣ x + r ; θ ^ ) = a r g m i n r , ∣ ∣ r ∣ ∣ < ε l o g p ( y ∣ x + r ; θ ^ ) (1) loss=-\mathop{log}p(y|x+r_{adv};\theta)\tag1\\ \mathop{where}r_{adv}=-\mathop{argmax}\limits_{r,||r||<\varepsilon}\mathop{log}p(y|x+r;\hat\theta) =\mathop{argmin}\limits_{r,||r||<\varepsilon}\mathop{log}p(y|x+r;\hat\theta) loss=−logp(y∣x+radv;θ)whereradv=−r,∣∣r∣∣<εargmaxlogp(y∣x+r;θ^)=r,∣∣r∣∣<εargminlogp(y∣x+r;θ^)(1)
min-max公式
m i n θ E ( x , y ) ∼ D [ m a x r , ∣ ∣ r ∣ ∣ < ε L ( θ , x + r a d v , y ) ] \mathop{min}\limits_{\theta}\mathbb{E}_{(x,y)\sim D}[\mathop{max}\limits_{r,||r||<\varepsilon}L(\theta,x+r_{adv},y)] θminE(x,y)∼D[r,∣∣r∣∣<εmaxL(θ,x+radv,y)]
梯度下降

假设损失函数是：
L = − l o g p ( y ∣ x ; θ ) (2) L=-\mathop{log}p(y|x;\theta)\tag2 L=−logp(y∣x;θ)(2)
使用一阶泰勒展开（用线性函数逼近），得：
L ( θ + Δ θ ) ≃ L ( θ ) + L ′ ( θ ) Δ θ (3) L(\theta+\Delta \theta)\simeq L(\theta)+L'(\theta)\Delta \theta\tag3 L(θ+Δθ)≃L(θ)+L′(θ)Δθ(3)

L ( θ + Δ θ ) − L ( θ ) ≃ L ′ ( θ ) Δ θ (4) L(\theta+\Delta \theta)-L(\theta)\simeq L'(\theta)\Delta \theta\tag4 L(θ+Δθ)−L(θ)≃L′(θ)Δθ(4)

泰勒公式：
f ( x ) = f ( x 0 ) + f ′ ( x 0 ) ( x − x 0 ) + o ( x ) f ( x + Δ x ) ≃ f ( x ) + f ′ ( x ) Δ x f(x)=f(x_0)+f'(x_0)(x-x_0)+o(x)\\f(x+\Delta x)\simeq f(x)+f'(x)\Delta x f(x)=f(x0)+f′(x0)(x−x0)+o(x)f(x+Δx)≃f(x)+f′(x)Δx
公式(4)描述参数的微小变动 Δ θ \Delta \theta Δθ会引起损失函数怎样的变动。当 Δ θ = − η L ′ ( θ ) \Delta \theta=-\eta L'(\theta) Δθ=−ηL′(θ)时，
L ( θ + Δ θ ) − L ( θ ) ≃ − L ′ 2 ( θ ) L ( θ + Δ θ ) < L ( θ ) (5) L(\theta+\Delta \theta)-L(\theta)\simeq -L'^2(\theta)\tag5\\ L(\theta+\Delta \theta)<L(\theta) L(θ+Δθ)−L(θ)≃−L′2(θ)L(θ+Δθ)<L(θ)(5)
在迭代求解时， Δ θ = − η L ′ ( θ ) \Delta \theta=-\eta L'(\theta) Δθ=−ηL′(θ)会使得损失不断变小。负梯度方向是使函数值下降最快的方向。

同样，可以使用梯度求解使得loss增大的微小扰动 r a d v r_{adv} radv。

４.1 Fast Gradient Sign Method(FGSM)

r a d v = ϵ ⋅ s g n ( ∇ x L ( θ , x , y ) ) r_{adv}=\epsilon\cdot \mathop{sgn}(\nabla_xL(\theta,x,y) ) radv=ϵ⋅sgn(∇xL(θ,x,y))

s g n sgn sgn是符号函数， ϵ = 0.25 \epsilon=0.25 ϵ=0.25就能给单层分类器造成99.9%的错误率。

４.2 Fast Gradient Method(FGM)

Goodfellow在15年的ICLR [1] 中提出了Fast Gradient Sign Method（FGSM）。随后在17年提出FGM方法，只是在扰动计算部分做了简单修改。
r a d v = ϵ ⋅ g / ∣ ∣ g ∣ ∣ 2 g = ∇ x L ( θ , x , y ) r_{adv}=\epsilon\cdot g/||g||_2\\ g=\nabla_xL(\theta,x,y) radv=ϵ⋅g/∣∣g∣∣2g=∇xL(θ,x,y)
实际上就是取消符号函数，用二范数做了一个放缩。原文中norm是，每个输入的矩阵norm。如x的embedding结果时(B,L,H),norm后为(B,1,1)。为简单实现，对batch数据进行norm。

4.3 Projected Gradient Descent(PGD)

内部max的过程，本质上是一个非凹的约束优化问题，FGM解决的思路其实就是梯度上升，那么FGM简单粗暴的“一步到位”，是不是有可能并不能走到约束内的最优点呢？当然是有可能的。于是，一个很intuitive的改进诞生了：Madry在18年的ICLR中[8]，提出了用Projected Gradient Descent（PGD）的方法，简单的说，就是“小步走，多走几步”，如果走出了扰动半径为ϵ的空间，就映射回“球面”上，以保证扰动不要过大

5 实验结果

在多个任务上的测试结果：

在这里插入图片描述

在两个文本分类上的测试结果：

在这里插入图片描述

6 实现

6.1 pytorch实现[2]

class FGM():
    """ 快速梯度对抗训练
    """
    def __init__(self, model):
        self.model = model
        self.backup = {}

    def attack(self, epsilon=1., emb_name='word_embeddings'):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name:
                self.backup[name] = param.data.clone()
                norm = torch.norm(param.grad)
                if norm != 0 and not torch.isnan(norm):
                    r_at = epsilon * param.grad / norm
                    param.data.add_(r_at)

    def restore(self, emb_name='word_embeddings'):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name:
                assert name in self.backup
                param.data = self.backup[name]
        self.backup = {}

按以下方式使用：

# 初始化
fgm = FGM(model)
for batch_input, batch_label in data:
    # 正常训练
    loss = model(batch_input, batch_label)
    loss.backward() # 反向传播，得到正常的grad
    # 对抗训练
    fgm.attack() # 在embedding上添加对抗扰动
    loss_adv = model(batch_input, batch_label)
    loss_adv.backward() # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
    fgm.restore() # 恢复embedding参数
    # 梯度下降，更新参数
    optimizer.step()
    model.zero_grad()

6.2 keras实现[3]

def adversarial_training(model, embedding_name, epsilon=1):
    """给模型添加对抗训练
    其中model是需要添加对抗训练的keras模型，embedding_name
    则是model里边Embedding层的名字。要在模型compile之后使用。
    """
    if model.train_function is None:  # 如果还没有训练函数
        model._make_train_function()  # 手动make
    old_train_function = model.train_function  # 备份旧的训练函数

    # 查找Embedding层
    for output in model.outputs:
        embedding_layer = search_layer(output, embedding_name)
        if embedding_layer is not None:
            break
    if embedding_layer is None:
        raise Exception('Embedding layer not found')

    # 求Embedding梯度
    embeddings = embedding_layer.embeddings  # Embedding矩阵
    gradients = K.gradients(model.total_loss, [embeddings])  # Embedding梯度
    gradients = K.zeros_like(embeddings) + gradients[0]  # 转为dense tensor

    # 封装为函数
    inputs = (model._feed_inputs +
              model._feed_targets +
              model._feed_sample_weights)  # 所有输入层
    embedding_gradients = K.function(
        inputs=inputs,
        outputs=[gradients],
        name='embedding_gradients',
    )  # 封装为函数

    def train_function(inputs):  # 重新定义训练函数
        grads = embedding_gradients(inputs)[0]  # Embedding梯度
        delta = epsilon * grads / (np.sqrt((grads**2).sum()) + 1e-8)  # 计算扰动
        K.set_value(embeddings, K.eval(embeddings) + delta)  # 注入扰动
        outputs = old_train_function(inputs)  # 梯度下降
        K.set_value(embeddings, K.eval(embeddings) - delta)  # 删除扰动
        return outputs

    model.train_function = train_function  # 覆盖原训练函数

使用方式：

# 写好函数后，启用对抗训练只需要一行代码
adversarial_training(model, 'Embedding-Token', 0.5)

参考：

[1] Explaining and Harnessing Adversarial Examples

[2] [炼丹技巧]功守道：NLP中的对抗训练 + PyTorch实现

[3] 对抗训练浅谈：意义、方法和思考（附Keras实现）

[4] 泛化性乱弹：从随机噪声、梯度惩罚到虚拟对抗训练

[5] Adversarial Training Methods for Semi-Supervised Text Classification

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对抗训练的相关文章

人群计数（Crowd Counting）研究综述

52CV曾经报道过两篇关于人群计数的新出论文 xff08 可在精华文章汇总中找到 xff09 xff0c 皆获得不少关注 xff0c 今天的文章来自复旦大学计算机的在读博士老田和电闪雷鸣为我们介绍人群计数的相关技术和进展 xff0c 想对此
ICCV 2019 | 视频综合理解：行为识别、场景识别以及视频综述

点击我爱计算机视觉标星 xff0c 更快获取CVML新技术本文经作者授权转载自知乎 xff1a https zhuanlan zhihu com p 91986833 未经许可 xff0c 禁止二次转载导语 xff1a 计算机视觉领域顶
AAAI 2020 | 北理工&阿里文娱：你所看视频的介绍，可以用到这样的「图像描述」技术...

点击我爱计算机视觉标星 xff0c 更快获取CVML新技术机器之心发布机器之心编辑部人工智能顶级会议 AAAI 2020 将于 2 月 7 日 2 月 12 日在美国纽约举办 xff0c 不久之前 xff0c AAAI 2020 公布
ubuntu11.10上安装QT5.1.0

今天开始学习QT xff0c 首先当然是搭建开发环境了 QT是个跨平台的C 43 43 界面开发系统 xff0c 因此在Windows MacOS Linux上都可以找到很好的开发工具我决定先从linux中的开发工具入手 Nokia卖掉Q
CVPR2020 | 当目标跟踪遇上对抗攻击

论文链接 https arxiv org abs 2003 09595 代码链接 xff1a https github com MasterBin IIAU CSA 研究背景目标跟踪近年来 xff0c SiamRPN系列在目标跟踪领域大
CVPR 2020 论文大盘点-超分辨率篇

本文盘点CVPR 2020 所有超分辨率 xff08 Super Resolution xff0c SR xff09 技术相关论文 xff0c 总计21篇 xff0c 超分辨率是CV领域传统方向 xff0c 下面这张图让你一眼明白它要做什么
CVPR 2020 论文大盘点-语义分割篇

图像分割应用广泛 xff0c 在CVPR 2020 论文中所占比例很高 xff0c 可说是一大热门 xff0c 有110多篇相关论文 xff0c 本文盘点CVPR 2020 所有语义分割 xff08 Semantic Segmentatio
CVPR 2020 论文大盘点-去雨去雾去模糊篇

本文盘点CVPR 2020 所有图像去雨去雾去模糊的论文去雨示意图 xff1a 去雾示意图 xff1a 去模糊示意图 xff1a 作为底层图像处理任务 xff0c 这三个方向有共同特点 xff1a 现有技术无法真实模拟下雨起雾模糊
致盲目标检测算法，阿里&清华发起 “对抗攻击” 挑战赛！

疫情期间在家精进技术却遭遇服务器短缺 xff1f 想畅快体验算力自由 xff0c 挑战高难度目标检测攻击场景吗 xff1f 这里有一个完美实现上述目标 xff0c 还能获得阿里校招绿通万元奖金权威证书和高定礼品 xff0c 更可去顶会当
一文读懂YOLOv5 与 YOLOv4

作者 xff1a William 来源 xff1a 自动驾驶全栈工程师知乎专栏链接 xff1a https www zhihu com people william hyin columns YOLO之父Joseph Redmon在今年年
51篇最新CV领域综述论文速递！涵盖14个方向：目标检测/图像分割/医学影像/人脸识别等方向...

导读本文共汇总了从2020年4月至今的计算机视觉领域综述性论文 xff0c 共54篇 xff0c 涵盖图像分割图像识别人脸识别检测医学影像目标检测 3D方向 xff08 自动驾驶深度估计 xff09 GAN 文本检测与识别姿
ECCV 2020 论文大盘点-目标检测篇

本文盘点ECCV 2020 与目标检测相关的研究 xff0c 包含目标检测新范式密集目标检测点云目标检测少样本目标检测水下目标检测域适应目标检测弱监督目标检测训练策略等 xff0c 总计 41 篇 xff0c 其中 2 篇 O
2020 科大讯飞全球开发者大会节目单来了！

我爱计算机视觉微信号 aicvml QQ群 805388940 微博知乎 64 我爱计算机视觉投稿 amos 64 52cv net 网站 www 52cv net 在看 xff0c 让更多人看到点击官网立即报名
Fast-SCNN：多分支结构共享低级特征的语义分割网络

介绍一篇 BMVC 2019 语义分割论文 Fast SCNN Fast Semantic Segmentation Network xff0c 谷歌学术显示该文已有62次引用论文 xff1a https arxiv org pdf 19
【Eigen】Chapter3 稀疏线性代数 Sparse Linear Algebra

xff08 1 xff09 稀疏矩阵操作 1 xff09 稀疏矩阵格式在许多应用中 xff0c 矩阵其只有少量非零系数 xff0c 这样的矩阵称为稀疏矩阵 Sparse Matrix 在这种情况下 xff0c 采用稀疏矩阵的存储方式 xf
水表读数自动识别，基于DB和CRNN的方法

尽管智能水表正在取代老式的机械水表但在许多地区 xff08 及老小区 xff09 由于环境成本等因素的限制机械水表木得办法被替换所以依旧需要人工手动抄表为了实现对老式机械水表的自动识别这篇我们讲讲2020CCF训练赛的场景文字
CVPR 2023 | 北大提出T-SEA: 自集成策略实现更强的黑盒攻击迁移性

关注公众号 xff0c 发现CV技术之美本文分享 CVPR 2023 论文 T SEA Transfer based Self Ensemble Attack on Object Detection xff0c 北大提出T SEA 自集成
图文理解能力强大！多模态对话生成模型：mPLUG-Owl，已开源！

关注公众号 xff0c 发现CV技术之美 miniGPT 4的热度至今未减 xff0c 距离LLaVA的推出也不到半个月 xff0c 而新的看图聊天模型已经问世了今天要介绍的模型是一款类似于miniGPT 4和LLaVA的多模态对话生成模
最大规模评测！通用AI大模型Segment Anything在医学影像分割的性能究竟如何？

关注公众号 xff0c 发现CV技术之美今天推荐一篇医学图像分析领域的最新研究成果 xff1a 深圳大学 xff1a 倪东教授课题组论文作者 xff1a 黄雨灏 xff0c 杨鑫 xff0c 刘恋 xff0c 周涵 xff0c 常澳 x
能看图、会聊天，还会跨模态推理和定位，能落地复杂场景的DetGPT来了

关注公众号 xff0c 发现CV技术之美本文转自机器之心 xff0c 作者港科大LMFlow团队 amp 港大NLP实验室一直以来 xff0c 人类梦想着机器人能够辅助人类处理生活和工作的事情请帮我调低空调的温度 xff0c 甚至请

随机推荐

致敬金庸：武侠版编程语言...Java像张无忌还是令狐冲？

我就喜欢这样等新闻消失热点过去人们快要遗忘的时候用自己的方式想起他让他被人想起短评 xff1a 夫千里之远 xff0c 不足以举其大 xff1b 千仞之高 xff0c 不足以举其深倚天屠龙记短评 xff1a 这世间和张三丰
大数据（巨量数据集合（IT行业术语））

大数据 xff08 巨量数据集合 xff08 IT行业术语 xff09 xff09 大数据定义对于大数据 xff08 Big data xff09 研究机构Gartner给出了这样的定义大数据是需要新处理模式才能具有更强的决策力洞
乌班图安装 Kalibr

安装ROS Melodic 1 Installation 1 1 Configure your Ubuntu repositories http www 360doc com content 18 0417 15 54525756 7463
STM32F103标准库开发---Uart串口通信实验---函数发送和中断接收

STM32F103标准库开发目录文章目录一 Uart串口通信函数发送 1 Uart串口发送标准库函数单字节发送 2 Uart串口检测标志标准库函数 3 Uart串口函数发送具体程序二 Uart串口通信中断接收 1 Ua
OVN 简介

文章目录 OVN 介绍OVN的架构OVN 应用OVN 信息流配置数据状态信息 Chassis 设置逻辑网络 OVN 介绍 Open vSwitch xff08 OVS xff09 是一款开源的虚拟交换机 xff0c 控制协议方面它不但支持
STM32Cube的串口设置（二）一个串口接收另一个串口发送

串口系列 STM32Cube的串口设置 xff08 一 xff09 即学即用通过串口设置第一部分大家应该基本会使用单个串口进行收发了所以本次介绍通过串口进行转发适合情景为一个串口设备波特率为38400 xff0c 但是接收模块仅支持1
OVN 安装，使用，流表分析

文章目录 OVN 安装环境准备安装 OVN 安装环境准备两台 ubuntu 18 04 管理网络 172 18 22 0 24 172 18 22 197 192 168 22 198 安装 apt get update apt get
OVN 流表基础 -- 基于 kubeOVN （一）

文章目录 Kubectl ko 工具分析Nbctl SbctlTrace Ovn 流表MatchActionRegisterTable 介绍Logical Switch DatapathsLogical Router Datapaths K
linux（ubuntu）下杀毒软件clamav的安装使用

可以使用套装命令 apt y install clamav clamtk clamav daemon clamdscan device tree compiler 也可以挨个安装 apt y install clamav apt y ins
npm 使用安装超时的解决办法

在安装vue的过程中 xff0c 每每用到npm的时候都会超时 xff0c 必须使用淘宝镜像永久使用 npm config set registry https registry npm taobao org 临时使用 npm insta
树莓派4b连接手机热点wifi及远程桌面连接

写在前面 xff1a 本人也是初步使用树莓派 xff0c 文中出现的好多问题基本都是查CSDN的各路大佬解决的 xff0c 如果说能够帮到你就很开心啦使用教程 xff1a 1 SD卡上烧写操作系统 xff1a xff08 1 xff09
《元学习meta learning)》2020综述论文大全！

导读元学习旨在学会学习 xff0c 是当下研究热点之一最近来自爱丁堡大学的学者发布了关于元学习最新综述论文 Meta Learning in Neural Networks A Survey xff0c 值得关注 xff0c 详述了元学
Python文件读写时的换行符与回车符

1 背景知识 ASCII码中的换行符与回车符 xff1a 换行符 10 LF 39 n 39 回车符 13 CR 39 r 39 在操作系统的历史中 xff0c 有很多种方法来表示另起一行 xff0c 但 39 n 39 和 39 r 39
Webpack5学习笔记（基础篇五）—— mode之Development环境相关参数配置

在Webpack5中 xff0c mode xff08 模式 xff09 有三种 xff1a development xff08 开发环境模式 xff09 production xff08 生产环境模式 xff09 none或 39 39
mac安装nvm报错 curl: (7) Failed to connect to raw.githubusercontent.com port 443: Connection refused解决方案

每次在使用新电脑时 xff0c 都要配置一些东西 xff0c 今天才使用Mac按照nvm官网提示安装nvm时 xff0c 就碰到了报 curl 7 Failed to connect to raw githubusercontent com
OpenStack版本 - 发布时间 - 及其组件

Austin xff08 2010 10 xff09 xff1a Nova Glance Keystone Horizon Swift QuantumBexar xff08 2011 02 xff09 xff1a Nova Glance K
总结：数据清洗的一些总结

前言在整理项目的时候发现清洗过程是一个非常细节的过程 xff0c 几乎贯穿始终 xff0c 也是后续步骤特征提取等的前置条件 xff0c 所以整理如下因为展开较大 xff0c 所以我已近上传mindnode脑图和原始照片尺寸 xff0c
Ubuntu18.04+Melodic+UR5

文章目录配置与使用文件内容ur gazebo ur5 ROS Gazebo pickup 配置与使用 https github com ros industrial universal robot有详细说明用Gazebo roslaun
cuda10.0 安装torch1.7.1

pip install torch1 7 1 43 cu92 torchvision0 8 2 43 cu92 torchaudio 61 61 0 7 2 f https download pytorch org whl torch st
对抗训练

文章目录 1 定义2 对抗训练 xff1a 从CV到NLP2 1 CV中的数据格式2 2 NLP中数据格式 xff13 对抗样本与数据增强样本 xff14 如何确定微小扰动 xff14 1 Fast Gradient Sign Method

对抗训练

文章目录

1、定义

2、对抗训练：从CV到NLP

2.1 CV中的数据格式

2.2 NLP中数据格式

３、对抗样本与数据增强样本

４ 如何确定微小扰动

４.1 Fast Gradient Sign Method(FGSM)

４.2 Fast Gradient Method(FGM)

4.3 Projected Gradient Descent(PGD)

5 实验结果

6 实现

6.1 pytorch实现[2]

6.2 keras实现[3]

对抗训练 的相关文章

随机推荐

热门标签

４如何确定微小扰动

对抗训练的相关文章