论文阅读:DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection(Deepfake模型快速调参)

2023-11-04

一、论文信息

论文名称:DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection

作者团队:

项目主页:https://github.com/rshaojimmy/DeepFake-Adapter(代码暂未开源)

二、动机与创新

动机:目前的deepfake检测模型泛化能力差,将其归因于过拟合于低级的伪造模式,现有的 deepfake 检测方法仅关注低级别的伪造特征,例如局部纹理、混合边界或频率信息,这些特征可能无法有效对抗看不见或低质量的伪造,而伪造检测也应该关注高级语义,例如人脸风格和形状,某些人脸操作方法会改变这些语义,例如FaceForensics++数据集中的DeepFake和FaceSwap。这些高级语义可以用来进行深度伪造检测,因为它们可以抵御低级特征的变化,使用高级语义可以提高deepfake检测方法的泛化能力,使它们在对抗看不见或低质量的伪造方面更有效。

 创新:提出了一个针对深度伪造模型的高效的参数微调方法,考虑ViT模型能够提取到高级的语义信息,本研究利用参数微调方法微调ViT模型用于深度伪造检测。

三、方法

提出的模型有N个阶段,每一层都包括一个预训练的ViT,其参数在训练期间被冻结;以及一个Deepfake-adapter,其具有用于快速适应的可训练的参数。每个阶段都包含预训练ViT的MHSA和MLP层。ViT的patch embedding层也被冻结。该方法是一个双层Adapter,包括两种类型的Adapter:全局感知瓶颈适配器 (GBA) 和局部感知空间适配器 (LSA)。

 1、Globally-aware Bottleneck Adapter (GBA)

1)ViT模型的MHSA层倾向于提取图像的全局信息,例如面部融合边界,GBA被设计为瓶颈结构保存以用于快速适应的参数,想通过在每个MHSA模块之后插入瓶颈结构快速训练模型,GBA与ViT的MLP层平行。

2)瓶颈结构由向下投影线性层 (DOWN) 和向上投影线性层 (UP) 组成,中间有一个 ReLU 层,用于非线性变换(类似LoRA)。 瓶颈结构的目的是保存参数以便快速适应,并权衡全局低级特征在适应过程中的重要性。

3)在两个投影层之后添加了一个可学习的比例函数(SC),以自适应地权衡全局低级特征在适应过程中的重要性。 GBA 的整个适应过程旨在使用更多全局低级伪造特征(例如混合边界)调整预训练的 ViT,以帮助进行深度伪造检测。

 2、Locally-aware Spatial Adapter(LSA)

1) 与卷积神经网络(CNN)相比,ViT 不太能根据局部低级特征区分真脸和假脸,所以引入了局部感知的空间适配器(LSA)来适应更多的低级伪造特征,如纹理,LSA由LSA-H(head)和LSA-I(interaction)组成。

2)LSA-H,将CNN的卷积运算整合到ViT中。它与 ViT 的patch embedding层平行,尝试从一开始就捕获更多的输入图像的局部低级伪造特征。其使用标准 CNN 作为基础网络来提取基础特征图,由三个 Convolution-batchnorm-Relu 区块和一个最大池化层组成。然后,使用三个类似的卷积块来提取多个中间特征图。中间特征图由各种金字塔分辨率、1/r1、1/r2 和 1/r3 分辨率组成,对应于原始输入图像的大小。将特征投射到相同的维度 D 中,然后连接成一个表示为 fspa 的特征向量。 在此基础上,LSA-H 聚合了具有不同空间分辨率的特征,捕获细粒度和局部低级别的伪造特征,例如纹理,这些特征对于检测深度伪造很重要。

 3)LSA-I,LSA 的交互部分捕获局部低级伪造,这些伪造通过一系列交叉注意力与预先训练的 ViT 中的特征进行交互。在第 i 阶段,第一次交互是通过 feature fispa 和 ViT fivit 一开始的特征之间的多头交叉注意力 (MHCA) 进行的。在此 MHCA 中,归一化的 fivit 作为Q,标准化 fispa 被视为K和V。这种互动的目的是通过聚合具有不同空间分辨率的特征来捕捉细粒度和丰富的局部伪造,通过使整个适应过程能够意识到局部低级伪造品,该方法旨在提高深度伪造方法的泛化能力。一旦在第 i 阶段通过 ViT 的整个向前过程获得特征 fi+1vit,则在 ViT 结束时通过在 fispa 和 fi+1vit 之间进行多头交叉注意力 (MHCA) 来进行第二次互动。在这个 MHCA 中,通过将标准化 fispa 作为查询并将标准化 fi+1vit 作为键和值来切换 K、Q、V。 第二次交互有助于进一步完善功能,并将deepfake数据的全球和本地伪造线索整合到检测过程中。

 四、实验结果

作者提出的方法能够区分真实和虚假的图像或视频,也可以泛化到没见过的样本或降级的样本中检测深度伪造。GBA 和 LSA 模块需要训练的参数要少得多(不到原始大型预训练的 ViT 的 20%)。这使得所提出的方法可以轻松扩展到各种deepfake数据集,并且可以部署在经济实惠的GPU机器上进行训练

 训练集: FF++ 数据集的DF和FS,作者认为这两种操作类型改变了高级语义,风格和形状等。

本文提出的方法不仅在检测高质量伪造品方面表现良好,而且在检测模糊、压缩和噪声的低质量伪造品方面具有区别性和鲁棒性。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读:DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection(Deepfake模型快速调参) 的相关文章

  • 计算机图形学期刊和会议

    目录 中国计算机学会推荐国际学术期刊 计算机图形学与多媒体 一 A类 二 B类 三 C类 中国计算机学会推荐国际学术会议 计算机图形学与多媒体 一 A类 二 B类 三 C类 中国计算机学会推荐国际学术期刊 计算机图形学与多媒体 一 A类 序
  • 光纤收发器怎么连?光纤收发器连接图解!

    光纤收发器可以实现光信号和电信号的转换 通过光纤进行信号的转换 最后和一些设备连接 让你的传输通信畅通无阻 当我们远距离传输时 通常会使用光纤来传输 因为光纤的传输距离很远 一般来说单模光纤的传输距离在10千米以上 而多模光纤的传输距离最高
  • C++报错提示某类名不是类或命名空间名称

    在学习C 的友元时 遇到一个问题 两个类互相调用时报错 如图 include
  • 三菱数控CNC系统G代码M代码大全

    G00 快速定位 G01 直线补间切削 G02 圆弧补间切削CW 顺时针 G03 圆弧补间切削CCW 逆时针 G02 3 指数函数补间 正转 G03 3 指数函数补间 逆转 G04 暂停 G05 高速高精度制御 1 G05 1 高速高精度制
  • C++ //STL 简介

    STL简介 STL Standard Template Library 即标准模板库 是一个具有工业强度的 高效的C 程序库 STL的一个重要特点是数据结构和算法的分离 STL另一个重要特性是它不是面向对象的 STL六大组件 容器 Cont

随机推荐

  • 非线性解方程组c语言_08 -- 非线性有限元分析方法

    到目前为止 讨论的都是线性问题 这里采用了两个基本假设 1 材料的应力 应变关系是线性的 D 2 结构的应变 位移关系是线性的 B 非线性有限元分析方法大同小异 以材料非线性为例 1 当材料的应力 应变关系是非线性时 刚度矩阵不是常数 与位
  • 代码管理工具SVN

    svn 什么是svn SVN是Subversion的简称 是一个开放源代码的版本控制系统 相较于RCS CVS 它采用了分支管理系统 它的设计目标就是取代CVS 互联网上很多版本控制服务已从CVS迁移到Subversion 说得简单一点SV
  • 力扣-->#剑指Offer 563 . 二叉树倾斜

    这道题要理解有一定的困难 首先看到这样的题目肯定想到的就是遍历 其次 需要有一个值来记录倾斜度 即 left right 再者 需要一个函数来帮忙辅助计算倾斜度 即findSum class Solution int findSum Tre
  • RIP、OSPF等路由协议严格意义上讲属哪一层?

    1 RIP基于UDP BGP基于TCP OSPF和EIGRP基于IP 这些在TCP IP协议栈中定义的路由协议用于发现和维护前往目的地的最短路径 你可以认为它们不属于网络层协议 注意 是用 based on 而不是实现了 BGP用TCP 所
  • 微信公众号h5页面实现授权,前端部分

    授权步骤 微信开发工具上配置公众号的apiId 微信环境内调起微信的授权功能 代码实现 此段代码放在app vue的监听函数中 每当路由发生变化 都会判断此页面是否已授权 没授权的话则进行授权 watch route handler fun
  • 4. 消息中心的设计与实现

    消息中心的设计与实现 一 引言 运用场景 1 消息的主动提醒 客户端被动接收 2 客户模块 及时通讯 3 单一登录 一个账号只能在一个设备登录 消息中心的实现方案 1 客户端轮询 2 TCP长连接 常用 Java的长连接的方案 Java B
  • windows命令行下ftp连接超时的可能原因

    1 需要连接的主机没有启用ftp服务 iis没有建立ftp站点 ftp身份验证设置不当 详情参考博文 windows下使用ftp 以及 windows开启ftp服务 两篇博文有重复的部分 我将他们取并集操作了一遍 另外 我还处理了iis未授
  • 使用Visual Studio编译ffmpeg

    一 首先参照下面的链接配置和编译 FFmpeg在VS2017下的编译 vs2017 ffmpeg源码编译 鱼儿 1226的博客 CSDN博客 vs2019编译ffmpeg源码为静态库动态库 完整步骤 亲测可行 ffmpeg vs 令狐掌门的
  • 嵩天老师-Python语言程序设计-Python123配套练习测验题目汇总整理

    测验1 Python基本语法元素 知识点概要 普遍认为Python语言诞生于1991年 Python语言中的缩进在程序中长度统一且强制使用 只要统一即可 不一定是4个空格 尽管这是惯例 IPO模型指 Input Process Output
  • 求最长不含重复字符的子字符串——C++

    声明 本文原题主要来自力扣 记录此博客主要是为自己学习总结 不做任何商业等活动 一 原题描述 剑指 Offer 48 最长不含重复字符的子字符串 请从字符串中找出一个最长的不包含重复字符的子字符串 计算该最长子字符串的长度 示例 1 输入
  • Linux查看进程命令

    查看进程 1 ps 命令用于查看当前正在运行的进程 grep 搜索 例如 ps ef grep java 表示查看所有进程里 CMD 是 java 的进程信息 2 ps aux grep java aux 显示所有状态 ps 3 kill
  • Sublime Text4 配置 Python3 环境、代码提示、编译报错教程

    1 配置 Python3 环境 单击 工具 gt 编译系统 gt 新建编译系统 弹出 替换里面的内容为 cmd G CodeTools anaconda3 python exe u file file regex File line 0 9
  • 数据中台数据分析过程梳理

    在当今社会中 随着企业的快速发展 相关业务系统的建设也会越来越多 新的业务模式 新的IT架构 多云环境的出现等等 而一些问题就逐渐暴露了出来 企业之间的IT无法做到互通 新模式生产数据与旧数据无法互通 企业IT架构错综复杂 底层数据互通更加
  • java使用opencv库二值化图片

    应用场景 截取监控视频图片保存到本地后用作后期监控视频角度调整参考 使用二值化后的图片并进行透明度降低进行监控矫正 package img import java awt Color import java awt image Buffer
  • delphi XE5如何把其它程序而不是本软件在通知区域的图标隐藏?不是关闭进程。请举个详细例子,比如Shell_NotifyIcon...

    Delphi XE5可以使用API函数Shell NotifyIcon来实现隐藏其它程序的图标 具体代码例子如下 procedure HideIcon APid Cardinal var noteIconData TNOTIFYICONDA
  • 关于 hostapd

    关于 hostapd 主页 http w1 fi hostapd hostapd是一个IEEE 802 11的AP和IEEE 802 1X WPA WPA2 EAP RADIUS验证器 此页面用于怎么在linux系统下使用它 其他操作系统请
  • 金融贷款行业实时高精准获客 ——三网运营商大数据

    都说生产是第一因素 但对于任何企业来说 客户来源才是第一因素 在大多数行业 获得客户的困难已经成为行业的挑战 如今 许多行业和企业获得客户的主要来源是在线促销和客户获取 现在几乎每个人都有一部手机 运营商可以根据移动客户的访问行为 通信行为
  • 排查java.net.MalformedURLException: Local host name unknown: java.net.UnknownHostException:***

    首先排查 vi etc sysconfig network 没有就加上 HOSTNAME 你的主机名 XXXX 如果有 接着排查 vi etc hosts 没有就加上 127 0 0 1 localhost localdomain loca
  • 2021年全球与中国高速分散机行业市场规模及发展前景分析

    2021年全球与中国高速分散机行业市场规模及发展前景分析 本报告研究全球与中国市场高速分散机的发展现状及未来发展趋势 分别从生产和消费的角度分析高速分散机的主要生产地区 主要消费地区以及主要的生产商 重点分析全球与中国市场的主要厂商产品特点
  • 论文阅读:DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection(Deepfake模型快速调参)

    一 论文信息 论文名称 DeepFake Adapter Dual Level Adapter for DeepFake Detection 作者团队 项目主页 https github com rshaojimmy DeepFake Ad