AI视觉对抗之隐身T恤「AI前沿」

2023-05-16

关注：决策智能与机器学习，深耕AI脱水干货

作者 | 许凯第

来源 | ECCV 2020

报道 | 机器之心

基于 AI 目标检测系统生成的对抗样本可以使穿戴者面对摄像头「隐身」。

由美国东北大学林雪研究组，MIT-IBM Watson AI Lab 和 MIT 联合研发的这款基于对抗样本设计的 T-shirt (adversarial T-shirt)，让大家对当下深度神经网络的现实安全意义引发更深入的探讨。目前该文章已经被 ECCV 2020 会议收录为 spotlight paper（焦点文章）。

论文链接：https://arxiv.org/pdf/1910.11099.pdf

在人脸识别和目标检测越来越普及的今天，如果说有一件衣服能让你在 AI 检测系统中「消失无形」，请不要感到惊讶。

熟悉 Adversarial Machine Learning（对抗性机器学习）的朋友可能不会觉得陌生，早在 2013 年由 Christian Szegedy 等人就在论文 Intriguing properties of neural networks 中首次提出了 Adversarial Examples（对抗样本）的概念。而下面这张将大熊猫变成长臂猿的示例图也多次出现在多种深度学习课程中。

很显然，人眼一般无法感知到对抗样本的存在，但是对于基于深度学习的 AI 系统而言，这些微小的扰动却是致命的。

随着科研人员对神经网络的研究，针对神经网络的 Adversarial Attack（对抗攻击）也越来越强大，然而大多数的研究还停留在数字领域层面。Jiajun Lu 等人也在 2017 年认为：现实世界中不需要担心对抗样本（NO Need to Worry about Adversarial Examples in Object Detection in Autonomous Vehicles）。

他们通过大量实验证明，单纯地将在数字世界里生成的对抗样本通过打印再通过相机的捕捉，是无法对 AI 检测系统造成影响的。这也证明了现实世界中的对抗样本生成是较为困难的，主要原因归于以下几点：

像素变化过于细微，无法通过打印机表现出来：我们熟知的对抗样本，通常对图像修改的规模有一定的限制，例如限制修改像素的个数，或总体像素修改大小。而打印的过程往往无法对极小的像素值的改变做出响应，这使得很多对于对抗样本非常有用的信息通过打印机的打印损失掉了。

通过相机的捕捉会再次改变对抗样本：这也很好理解，因为相机自身成像的原理，以及对目标捕捉能力的限制，相机无法将数字领域通过打印得到的结果再次完美地还原回数字领域。

环境和目标本身发生变化：这一点是至关重要的。对抗样本在生成阶段可能只考虑了十分有限的环境及目标的多样性，从而该样本在现实中效果会大大降低。

近年来，Mahmood Sharif 等人（Accessorize to a crime: Real and stealthy attacks on state-of-the-art face recognition.）首次在现实世界中，通过一个精心设计的眼镜框，可以人脸检测系统对佩戴者做出错误的判断。但这项研究对佩戴者的角度和离摄像头的距离都有严格的要求。之后 Kevin Eykholt 等人（Robust Physical-World Attacks on Deep Learning Visual Classification）对 stop sign（交通停止符号）进行了攻击。通过给 stop sign 上面贴上生成的对抗样本，可以使得 stop sign 被目标检测或分类系统识别成限速 80 的标志！这也使得社会和媒体对神经网络的安全性引发了很大的探讨。

然而，这些研究都还没有触及到柔性物体的对抗样本生成。可以很容易地想象到，镜框或者 stop sign 都是典型的刚性物体，不易发生形变且这个类别本身没有很大的变化性，但是 T 恤不同，人类自身的姿态，动作都会影响它的形态，这对攻击目标检测系统的人类类别产生了很大的困扰。

最近的一些工作例如 Simen Thys 等人（Fooling automated surveillance cameras: adversarial patches to attack person detection）通过将对抗样本打印到一个纸板上挂在人身前也可以成功在特定环境下攻击目标检测器，但是却没有 T 恤上的图案显得自然且对对抗样本的形变和运动中的目标没有进行研究。

来自美国东北大学，MIT-IBM Watson AI Lab 和 MIT 联合研发的这款 Adversarial T-shirt 试图解决上述问题，并在对抗 YOLOV2 和 Faster R-CNN（两种非常普及的目标检测系统）中取得了较好的效果。通过采集实验者穿上这件 Adversarial T-shirt 进行多个场景和姿态的视频采集，在 YOLOV2 中，可以达到 57% 的攻击成功率，相较而言，YOLOV2 对没有穿 Adversarial T-shirt 的人类目标的检测成功率为 97%。

设计原理

从多个已有的成功的攻击算法中得到启发，研究者们通过一种叫 EOT (Expectation over Transformation) 的算法，将可能发生在现实世界中的多种 Transformation（转换）通过模拟和求期望来拟合现实。这些转换一般包括：缩放、旋转、模糊、光线变化和随机噪声等。利用 EOT，我们可以对刚性物体进行对抗样本的生成。

但是当研究者们仅仅使用 EOT，将得到的对抗样本打印到一件 T 恤上时，仅仅只能达到 19% 的攻击成功率。这其中的主要原因就是文章上述提到的，人类的姿态会使对抗样本产生褶皱，而这种褶皱是无法通过已有的 EOT 进行模拟的。而对抗样本自身也是非常脆弱的，一旦部分信息丢失往往会导致整个样本失去效力。

基于以上观察，研究者们利用一种叫做 thin plate spline (TPS) 的变化来模拟衣服的褶皱规律。这种变化需要记录一些 anchor points（锚点）数据来拟合变化。于是研究者将一个棋盘格样式的图案打印到 T 恤上来记录棋盘格中的每个方块角的坐标信息，如下图所示：

这些锚点的坐标可以通过特定的算法自动得到无需手动标记。这样一个人工构建的 TPS 变化被加入了传统的 EOT 算法。这使得生成的对抗样本具备抗褶皱扰动的能力。

除此之外，研究者们还针对光线和摄像头可能引起的潜在变化利用一种色谱图进行的模拟，如下图所示：（a）数字领域中的色谱图；（b）该图通过打印机打印到 T 恤只会在通过相机捕捉到的结果；（c）通过映射 a-b 学到的一种色彩变换。

基于学习出的色彩变化系统，使得生成的对抗样本能最大限度的接近现实。最终该方法的整体框架如下：

通过增强的 EOT 和颜色转换系统，最小化 YOLOV2 的检测置信度，最终得到一个对抗样本。

除此之外，研究者们也第一次尝试了 ensemble attack (多模型攻击)。利用一张对抗样本同时攻击两个目标检测系统 YOLOV2 和 Faster R-CNN。结果显示不同于传统的加权平均的攻击方，利用鲁棒优化技术可以提高对两个目标检测系统的平均攻击成功率。

实验结果

首先，研究者们在数字领域做了基础的比较试验，结果发现相较于非刚性变化—仿射变换，TPS 变化可以将攻击成功率在 YOLOV2 上从 48% 提升到 74%，在 Faster R-CNN 上由 34% 提升到 61%！这证明了对于柔性物体，加入 TPS 变化的必要性。

之后研究人员将这些对抗样本打印到白色 T 恤上，让穿戴者在不同场合以各种姿态移动并对其录制视频。最后将采集到的所有视频送入目标检测系统进行检测，统计攻击成功率。

如下面的动图所示：

最终，在现实世界中，该方法利用 TPS 生成的样本对抗 YOLOV2 可以达到 57% 的攻击成功率，相较而言，仅使用仿射变换只能达到 37% 攻击成功率。

除此之外，研究者们还做了非常详尽的 ablation study：针对不同场景，距离，角度，穿戴者姿势进行研究。

结果显示，提出的方法对距离的远近和角度变化较为敏感，对不同的穿戴者和背景环境变化表现出的差异不大。

关于 AI 安全的更多讨论

生成对抗样本其实和深度神经网络的训练是同根同源的。通过大量样本学习得到的深度神经网络几乎是必然的存在大量的对抗样本。就像无数从事 Adversarial Machine Learning（对抗性机器学习）的研究者一样，大家充分意识到了神经网络的脆弱性和易攻击性。但是这并没有阻碍我们对深度学习的进一步研究和思考，因为这种特殊且奇妙的现象来源于神经网络本身，且形成原因至今没有明确的定论。而如何构建更加鲁棒的神经网络也是目前该领域的 open issue。

该研究旨在通过指出这种特性，以及它有可能造成的社会潜在危害从而让更多的人意识到神经网络的安全问题，最终目的是帮助 AI 领域构建更加鲁棒的神经网络从而可以对这些对抗样本不再如此敏感。

第一作者介绍

许凯第：美国东北大学 ECE 系 PhD 三年级学生，主要研究领域为 Adversarial Machine Learning，研究内容已经在发表在 NeurIPS、ICML、ICCV、ECCV、CVPR、ICLR 等众多机器学习和计算机视觉会议。

交流合作

请加微信号：yan_kylin_phenix，注明姓名+单位+从业方向+地点，非诚勿扰。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

视觉对抗之隐身

AI视觉对抗之隐身T恤「AI前沿」的相关文章

pb9 数据窗口的计算列

数据窗口中 xff0c 可以增加计算列 xff0c 进行合计平均或者其他计算动作在窗口的按钮 xff0c 或者其他事件中 xff0c 可以对数据窗口的计算列的表达式进行修改 xff0c 这样可以将数据窗口多用办法 xff1a dw 1
tar打包命令（linux）

1 打包命令 span class token function tar span cvf 归档路径被打包文件路径 span class token punctuation span c create archive v verbose
Python字符串与数组相互转换

Python中有join 和os path join 两个函数 xff0c 具体作用如下 xff1a join xff1a 连接字符串数组将字符串元组列表中的元素以指定的字符分隔符连接生成一个新的字符串os path join x
FastApi 文件上传upload

需要使用的Python包 xff1a fastapi和uvicorn span class token keyword import span time span class token keyword import span uvicor
zip/tar 分割压缩和合并解压

1 zip 分割压缩和合并解压 span class token comment 准备工作 xff1a 将文件或文件夹打包为zip压缩包 span span class token function zip span r src zip s
python 创建excel 并保存（两种方法）

1 概要 python中的包xlwt和xlsxwriter都是比较方便创建excel文件并写入数据的 2 xlwt 创建excel并保存 xlwt中 xff1a 通过xlwt Workbook 来新建工作簿 xff1b 通过 add she
Python 保留两位小数几种方法

一 xff1a 保留两位小数且做四舍五入处理四舍六入五成双 xff0c 四舍六入五凑偶的意思 xff0c 根据百度词条的解释如下 xff08 1 xff09 当精确位后面一位的数字是1 4的时候 xff0c 舍去 xff08 2 xf
XSS 攻击常用代码

1 XSS 攻击常用代码 span class token number 1 span 39 34 span class token punctuation span span class token punctuation span sp
xpath 爬虫案例

1 案例爬取糗百中的段子内容和作者名称 span class token keyword from span lxml span class token keyword import span etree url span class t
Selenium 鼠标滚动操作

1 JS处理滚动条问题 span class token number 1 span 滚动条回到顶部 xff1a js span class token operator 61 span span class token string 34
selenium 定位元素（并集）

并集 xff1a answer 61 driver find element By CLASS NAME info content and huida con text 1 id 说明 xff1a 通过元素的id属性来定位元素 xff0c
精细粒度访问控制：DBMS_RLS包实现数据库表行级安全控制

精细粒度访问控制 xff1a DBMS RLS包实现数据库表行级安全控制这是行级控制 xff0c 并且用的数据库提供的dbms包做的 xff0c 而不是视图或者触发器 xff0c 据说 xff0c 可以对所有的DML起作用精细粒度访问控
java获取json数组格式中的值

第一种方法 xff1a String str span class token operator 61 span span class token string 34 39 array 39 39 id 39 5 39 name 39 39
程序员面试经历

现在找工作已经没有了毕业以后那时候找工作的那种紧张心情自从在上家公司离职以后自己进行了一段时间的工作世界上本来没有面霸面试的多了也就成了面霸不得不承认一开始自己面试是有些紧张但是面试的多了也就不觉得紧张反而有些平淡了
宽度优先爬虫和带偏好的爬虫

互联网可以看成一个超级大的图 xff0c 而每个页面可以看成一个节点页面中的链接可以看成是图的有向边因此 xff0c 能够通过图的遍历得方式对互联网这个超级大图进行访问图的遍历可以分为宽度优先遍历和深度优先遍历 xff0c
The connection to the server localhost:8080 was refused

最近在学习安装Kubernetes集群的时候 xff0c 安装完执行sudo kubectl get nodes命令出现这个报错 xff1a 下面是解决方法 Master节点出现这个报错首先需要检查Master安装完Kubernetes后
给广大学习单片机的同学心得，如何学好单片机

单片机 Microcontrollers 是一种集成电路芯片 xff0c 是采用超大规模集成电路技术把具有数据处理能力的中央处理器CPU 随机存储器RAM 只读存储器ROM 多种I O口和中断系统定时器计数器等功能可能还包括显示驱动电
企业如何实现云计算价值的最大化

恒天云商业白皮书 xff1a http www hengtianyun com download show id 12 html 企业如何实现云计算价值的最大化卷首语虽然中国云计算产业尚处于导入和准备阶段 xff0c 但云产业生态链的构
ISP、IAP、ICP、JTAG、SWD的编程特点！种编程方式区别总结

转载自 xff1a http www eeskill com article id 38434 http bbs ic37 com bbsview 33838 htm 电子工程师都知道 xff0c 半导体技术发展迅猛 xff0c 带动了各种

随机推荐

OpenMP 参考（指令详解）

OpenMP 参考 xff08 指令详解 xff09 翻译 2011年03月21日 17 53 00 标签 xff1a parallel fortran newline list integer 工作 9866 编辑删除共享工作 xff
yum install brctl报错

安装brctl xff0c 如果使用下面命令会报错 xff0c 找不到包 yum install brctl 实际应该执行下面的命令 y 表示全部问题自动回答为是 yum install bridge utils y
喵小依踩奶篇

从刚来到现在 xff0c 喵小依踩奶奶的瞬间不甚枚举 xff0c 归纳总结 xff0c 大多出自以下几个意图 xff1a 1 xff0c 喵小依初来咋到时 xff0c 总会一个人出神的抱着自己的小毯子踩奶奶 xff0c 可能是在怀念呆
centos下终端分辨率

有时候 xff0c 终端分辨率不适合 xff0c 需要修改 xff0c 尤其是虚拟机的时候在 boot grub grub conf中 kernel 这行增加 vga 61 ask 重启 xff0c 就出现询问要那种显示模式 xff0c
Linux：备份你的工作和系统

1 xff0c 备份工具 xff1a dump span class token comment 使用dump备份 xff0c 会将原有设备上的数据覆盖掉 span dump 0u f dev nst0 web span class tok
Linux：用户与用户组管理

添加用户用户组场景 xff1a john的电脑丢了 xff0c 想借你的电脑用几天 xff0c 但是你的电脑里有一些私人文件不想让john看到 xff0c 于是乎 xff0c 你决定给john建立一个账号 xff1a span clas
Linux：/etc/passwd文件

待更新
赤池信息量准则（Akaike Information Criterion）

赤池信息量准则
tensorflow命令行参数：tf.app.flags.DEFINE_string、tf.app.flags.DEFINE_integer、tf.app.flags.DEFINE_boolean

tensorflow命令行参数 xff1a tf app flags DEFINE string tf app flags DEFINE integer tf app flags DEFINE boolean
***chapter 17 看图说话：将图像转换为文字

所谓Image Caption xff0c 是指从图片中自动生成一段描述性文字 xff0c 类似于看图说话本章主要介绍2个内容 xff1a 1 xff09 Image Caption的技术原理 xff1b 2 xff09 Image C
标准差（Standard Deviation）和标准误差（Standard Error）

点击打开 xff1a 标准差 xff08 Standard Deviation xff09 和标准误差 xff08 Standard Error xff09
R-squared 和 Adjusted R-squared 的区别

如果在现有model中 xff0c 再加入一个无关自变量 xff0c 则R squared的值仍然会增加 xff0c 但是 xff0c 实质上 xff0c model的拟合度并未增加 xff1b 为了弥补R suqared的缺陷 xff0
pip install出错： EnvironmentError:[WinError 5]拒绝访问

参考博文 xff1a python的pip10 1版本出现了安装包时的错误Could not install packages due to anEnvironmentError WinError 5 拒绝访问
UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 23: illegal multibyte se

参考博文 xff1a python读取中编码错误 xff08 illegal multibyte sequence xff09
vmware conveter5的使用操作指导-加上我的实验记录

实验内容 xff1a 源物理机 xff1a centos5 5 目标主机 xff1a esxi5 5 xff0c vcenter server5 5 converter xff1a 5 5 2 过程记录 xff1a 1 前几次向vcente
ros2遇到的问题和解决方法-----win10安装ros2_dashing

1 win10安装ros2 dashing可参考官方网站提供的安装方法https index ros org doc ros2 Installation Dashing Windows Install Binary 2 在下载安装的时候会很
华为笔试算法：清一色胡牌问题（java）

题目描述 xff1a 清一色是麻将番种之一 xff0c 指由一种花色的序数牌组成的和牌数字1 9 xff0c 每个数字最多有4张牌我们不考虑具体花色 xff0c 我们只看数字组合刻子 xff1a 三张一样的牌 xff1b 如 111
一知半见的oracle表函数

一知半见的oracle表函数 xff0c 管道化表函数 xff0c 好用于ETL xff0c 主要关键是 xff0c 可以在抽取过程中 xff0c 对数据进行转换来自 ITPUB博客 xff0c 链接 xff1a http blog it
October 15th 模拟赛A T2 NOIP2018五校联考黑暗之魂 Solution

题目空降 Description oi juruo热爱一款名叫黑暗之魂的游戏在这个游戏中玩家要操纵一名有点生命值的无火的余灰在一张地图中探险地图中有n个篝火 xff08 也就是存档点 xff09 在篝火处休息可以将生命值恢复满每个篝
AI视觉对抗之隐身T恤「AI前沿」

关注 xff1a 决策智能与机器学习 xff0c 深耕AI脱水干货作者许凯第来源 ECCV 2020 报道机器之心基于 AI 目标检测系统生成的对抗样本可以使穿戴者面对摄像头隐身由美国东北大学林雪研究组 xff0c MIT I

AI视觉对抗之隐身T恤「AI前沿」

AI视觉对抗之隐身T恤「AI前沿」 的相关文章

随机推荐

热门标签

AI视觉对抗之隐身T恤「AI前沿」的相关文章