【文献笔记】【精读】Metamorph: Injecting Inaudible Commands into Over-the-air V oice Controlled Systems

2023-05-16

文章地址:Metamorph: Injecting Inaudible Commands into Over-the-air V oice Controlled Systems

不开源

发现顶会的论文格式都一个样
前言介绍+系统设计说明+系统性能评估+相关工作综述+结论

文章目录

  • Insight
  • 1 INTRODUCTION
  • 2 PRELIMINARIES
  • 3 DESIGN
  • 4 EVALUATION
  • 5 RELATED WORK
  • 6 CONCLUSION

Insight

作者探究了利用声音通信远程攻击神经网络的可能性
即播放人耳听不见的噪声悄悄地干扰语音合成的结果,希望起一个警示的作用

1 INTRODUCTION

目前语音识别技术在很多领域迅猛发展
语音势识别:输入一段音频 I,输出一段文字 T, SR(I) = T

语音识别有一个问题,如果在I中加入一段人察觉不到的扰动,是不是可以影响输出的文本T?

can I +δ (an adversarial waveform that still sounds
like T to a human listener) played by a sender fool the SR
neural network at the receiver?

如果可以的话,就是一个严重的安全风险,别有用心之人会利用这个漏洞发起攻击,对自动驾驶、智能手机中的数据安全等都有威胁

下图就展示了一个干扰过程
在这里插入图片描述
令 H(I+δ) 为经历过信道失真后的信号,一般经历失真之后的信号就很难被识别出攻击者想要的 T‘ 了。如果能提前知道失真 H(·),就可以恢复T’,但是这不现实,因为这要求攻击者事先黑进受害设备,然后对其进行编程,发送一个反馈信号,传达H(·)。
因此,这篇paper探究的就是是否可以找到一种稳定的干扰 δ,在攻击者不知道H(·)的情况下也能稳定的影响语音识别系统的结果。

经作者实验,无线传输对于声学攻击的影响主要在于多径传播和设备硬件造成的频率选择性,虽然这两种频率选择源不能被精确 estimate,但是作者认为在达到信道的频率选择性起支配作用的距离之前,可以提取 aggregate distortion effect(聚合失真影响),一旦这种主要影响被提取,那么就可以将其加入声音合成(这里应该指δ的合成 )

基于以上思想,作者提出了 Metamorph with a “generate-and-clean” two-phase design.,那么是哪两步呢?
(1)收集一个小的 H(·) 测量数据集来生成初始 δ
(2)使用 domain adaptation algorithms 来改进 δ,以适应当前设备和环境的特征

作者认为这篇 paper 有着如下贡献:
(1)基于经验理解了 无线环境下限制 udio adversarial attacks 的因素
(2)针对限制无线攻击的挑战,提出了一系列有效的解决方案。
(3)开发了所设计系统的原型机,并且作了大量真实实验来评估其性能

2 PRELIMINARIES

3 DESIGN

4 EVALUATION

5 RELATED WORK

6 CONCLUSION

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【文献笔记】【精读】Metamorph: Injecting Inaudible Commands into Over-the-air V oice Controlled Systems 的相关文章

  • int为什么占4个字节?一个字节为什么是8位?

    不知道大家有没有思考过这样的问题 xff0c 一个字节为什么是8位呀 xff0c 也许还有小伙伴不知道我说的这些是什么 xff0c 没关系往下看 第一个解释 xff08 历史 xff09 是IBM为System 360设计了一套8位EBCD
  • K8S之kubectl命令详解及示例

    目录 1 查看类命令 2 操作类命令 3 进阶命令操作 4 kubectl replace 重启pod的四种方法 5 kubectl语法 1 查看类命令 获取节点和服务版本信息 kubectl get nodes 获取节点和服务版本信息 x
  • ROS运动规划学习五---global_planner

    文章目录 前言一 global planner功能包结构二 planner core1 执行过程2 calculatePotentials 3 getPlanFromPotential 总结 前言 本节将学习ROS中的全局规划期global
  • ROS自定义消息---发布数组和整型数据

    ROS自定义消息 数组和整型数据 前言一 ROS中的消息数据格式二 自定义话题消息1 新建msg文件2 编写发布者和接收者程序 总结 前言 ROS自带的消息格式已经包含一维数组 xff0c 有时候我们需要定义多维数组 xff0c 以及混合数
  • Markdown中的公式、字母表示汇总

    Markdown中的公式 字母表示汇总 1 常用希腊字母表2 数学公式 最近几个月打了很多Markdown公式 xff0c 隔一段时间就会忘一些表示方式 xff0c 还不如在这里慢慢汇总记录 xff0c 以后要用的时候来查就行了 xff01
  • CMake项目中神器:CMakeLists.txt

    首次接触 CMake xff0c 见识了 CMakeLists txt 的强大后 xff0c 赶紧整理出来分享一下 参考资料 xff1a Cmake 3 6 W3Cschool参考手册 本文讲述了一个 CMake 项目 xff0c 在从单文
  • TCP详解之拥塞控制

    概述 TCP模块还有一个重要任务 xff0c 就是提高网络利用率 xff0c 降低丢包率 xff0c 并保证网络资源对每条数据流的公平性 xff0c 这就是所谓的拥塞控制 拥塞控制的四个部分 xff1a 慢启动 拥塞避免 快速重传 快速恢复
  • frps搭建自己的内网穿透服务器

    frps搭建自己的内网穿透服务器 开发过程中 xff0c 很多时候我们需要用到内网穿透 xff0c 将自己的服务器映射到外网 xff0c 下面说一下怎么用frps搭建自己的内网穿透服务器 frps Github地址 里面有中文文档 xff0

随机推荐