从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？

2023-11-19

在世人对AI的“邪恶性”进行攻诘的浪潮中，AI造假，可能已经是现在排首位的理由了。

自从2017年Deepfake（深度伪造）横空出世以后，人们惊呼原来AI在造假方面简直天赋异禀。此后“AI生成内容”技术，特别是GAN算法的突飞猛进更加印证了这一事实。不仅仅是AI换脸，还有AI自动生成文本、语音、图像、视频等等一切数字内容。

除了AI换脸带来的色情视频泛滥之外，人们更进一步担心AI生成内容技术在隐私侵犯、威胁信息安全、操纵政治选举等方面带来全新挑战。

人们往往会假设，如果任由AI生成的内容在互联网中蔓延，将会更进一步冲毁互联网世界的真实性边界。

（被AI造假的扎克伯格“讽刺”自己的Facebook平台）

Deepfake之后，真相何在？

如果哪些是真，哪些是假，普通人都难以分辨的时候，那么组成社会基石的真相和信任将就此坍塌，但我们似乎还没有做好活在“无信任社会”的准备吧。

德国哲学家康德在《实践理性批判》中论证“人为什么不能说谎”的法则，揭示了“无信任社会”的悖论和荒谬。假如“人人可以说谎”是一条社会的通行法则，那么，每个人都不会再信任另一个人说的话，这样说话人的谎言也就不会得逞。说谎而无人相信，就陷入了自相矛盾的境地，反之“人人不能说谎”，才应该是正常社会的通行法则。

这就是说，只有在默认“人人应该诚实”的信任社会里，说谎者才可以通过成功骗到他人获利，也会因为谎言被戳穿而信誉破产。而在“无信任社会”中，信息的真假判断都难以进行，那只能默认一切都为“假”，才会不至于上当受骗。但是相应的代价是信任全无，合作难以达成，交流也不再可能，最终将会是社会的分崩离析。

当然这只是理论上面最极端的演绎。现实世界永远会在理论世界之下形成巨大的灰色空间，人性的基石仍将亘古不变，技术的演进也会一往无前，而人性的弱点就会在这两者的撕扯的张力中一直暴露无遗。每一代的新人类除了持续的学习、进化，以适应技术加速带来的全新挑战，似乎也没有什么更好的办法。

回到“Deepfake”为代表的“AI生成内容”技术来说，它既不会成为将我们的社会拖向“无信任”的深渊，也不会让我们的人性变得更好或更坏一点。在一个即将到来的“虚实相容、真假不分”的后真相世界当中，只会让适应这一变化的我们变得更加复杂和反脆弱。

所以。这一略带“贬义”的Deepfake（深度伪造）的技术名词，需要被我们重新塑造为一个技术中性词汇——Deep Synthesis（深度合成）。

为“深度合成”正名：AI的技术中性

科技的每一次突破，都可能带来意想不到的“副产品”。

就如同爱因斯坦发现了质能方程式之后，即使再不情愿，他也无法阻止原子弹的出现和使用。就在Deepfake这个“妖孽”在美国新闻网站Reddit被放出来之后，AI的领军人物Yann LeCun也在Twitter上深深反省：

“说真的，要是当初知道卷积神经网络(CNN)会催生Deepfake，我们还要不要发表它？”

随即LeCun自己就回答了这个问题。LeCun表示，即使不是我们首先公开发表，CNN也会由其他人或机构发明出来。而在2002年当时被公布出来以后，人们也不知道如何来利用它。换句话说，CNN的价值要在技术人员的不断探索下才能挖掘出来。

现在CNN正在被开发出各种各样的应用，既对世界有很多正向的积极影响，比如医疗诊断、自动驾驶、内容过滤以及安全监控等等，也可能引起一些负面的效果，比如侵犯隐私、造假诈骗、偏见歧视等等，好坏参半，可以各打五十大板。

简单来说，就是AI无罪，问题还是出在使用AI技术的人类身上。

以Deepfake技术所引发的AI换脸的色情视频泛滥来说，AI技术被应用于色情产业几乎是一件“必然如此”的过程。一方面，现代色情产业一直都是最新科学技术应用的急先锋，另一方面，AI在图像内容生成技术的发展正好迎来了突破临界点。最后一步就只剩下这个叫“Deepfakes”的用户最后的“灵机一动”了。

实际上，Deepfake为“AI内容生成”技术的普及起到了推波助澜的作用，但同时也带来难以抹去的污名化影响。而鉴于“AI内容生成”技术的发展早已超出AI换脸的范畴，技术商业领域正在试图用“深度合成”来为这一技术正名。

首先，Deepfake（深度伪造）一词明显以偏概全，其仅仅是“AI换脸”技术的早期代表，不足以包含所有的“AI生成内容”的技术。用Deep Synthesis（深度合成）可以更好地泛指所有AI生成算法和涵盖自动生成图像、视频、语音、文本、音乐等内容的合成技术。

其次，Deepfake尚未得到技术社区的广泛认可，只是被媒体大众叫顺嘴了而已。况且Deepfake自带的“腹黑”体质，对于AI技术的应用推广会带来直接的负面影响。

“深度合成”这个更为中性的技术名称，将会代替Deepfake来行使AI内容发展的应尽之责。那么，“深度合成”该如何撑起这重任呢？

“深度合成”的底气：技术加速和商业落地

“深度合成”技术，其实就是借助可以自主学习的深度学习算法模型来实现的，其主要使用的的两个技术就是“自动编码器”人工神经网络和 “生成对抗网络”（GAN）的人工神经网络组成。前者用于训练数据的合成，后者由生成器和鉴别器组成，一个用来进行新数据的生成和一个用来对其进行鉴别，经过二者无数次的对抗，最终生成出“以假乱真”的合成数据，其中就包括Deepfake所创造出来的换脸视频。

（GAN相关论文的发表情况）

从2014年，GAN提出一直到今天，已经经历了从CGAN、BigGAN 、StyleGAN等多个版本更新，其中每年的相关研究论文也在加速增长，可见学界对于GAN算法的重视和发展前景的看好。

（BigGAN 生成的包含各种类别的高清晰图片）

与此相应的，就是图像生成质量的突飞猛进，其中不仅可以实现人脸的合成，也能更一步实现图像叠加融合，或者直接生成全新的高清图片，以致于人眼根本难以分辨真假。

比如，去年MIT和IBM沃森联合实验室发布的一个基于GAN的AI艺术画师，就可以学习文艺复兴时期的画家的绘画风格，直接将现代人类的照片变成文艺复兴时期的画作。

其中的技术优势在于，GAN神经网络会根据自己学到的技巧为画面重新构图，也就是它是画出新的图片，而不是利用风格迁移的方式，改变原图的色彩。

其实，深度合成技术已经可以走得更远。除了单一的图像、音频合成之外，多维度的内容合成已经是一个趋势，这样可以将语音识别、人脸识别、唇形搜索等结合起来，进行人脸语音的合成，从而可以让一个人自然流利地说出自己从未说过的话。

此外，人脸合成之外，全身合成、3D合成虚拟人技术也成为当前的应用热点。刚刚过去的两会期间，搜狗联合新华社推出上岗的全球首个3D版AI合成主播，就已经可以在文本实时驱动面部表情和唇形，肢体动作、超写实细节呈现上面做到比拟真人的动态效果。

在“深度合成”技术的商业化方面，已经有众多行业和企业看到其应用场景和广阔市场。目前，“深度合成”已经在影视娱乐、社交通讯等多个行业的场景中开始发挥作用。

比如，在影视剧制作中，最直接的帮助就是提升音视频制作的效率，拓展创作想象空间；一些特殊情况下，还可以通过合成技术为影视剧的失声的演员进行声音合成，为已过世的演员进行“数字复活”；甚至直接创造虚拟数字人来进行影视剧集的制作。

在娱乐应用体验上面，最基本的脸部特效应用、换脸视频、动图，都已经多次在我们的生活中出现；虚拟偶像、虚拟主播、虚拟客服也随着深度合成技术的成熟而变得越逼真和可信。

在社交通讯上面，与其担心深度合成技术会暴露个人隐私，不如可以让深度合成技术帮我们在社交网络中建立自己的“数字分身”，就如同《头号玩家》里面每个人创建的虚拟形象一样，成为自己在网络世界的通行证。

此外，像电商营销、教育艺术、医疗科研等领域，深度合成技术带来的仿真数据和虚拟化内容都可以为这些产业带来新的应用场景或者直接推动该领域的技术进步。

显然，深度合成技术的这些正向价值正在为其换来更有底气的话语权和发展前景。但是这个一出现就饱受人类质疑和恐惧的AI技术，仍然值得我们认真对待其应用边界和规则。

“深度合成”的治理：

如何锁住“虚假内容”的恶龙

正如一切获得都必须付出代价一般，我们如果想要享受深度合成技术带来我们的一切生活便利和精神享受，同时就必须承受其带来的将数字世界全面虚拟化的代价。

深度合成技术所带来的“虚假内容”的社会风险将长期存在。首先，深度合成的开源技术和软件，让普通人们伪造、操纵音视频的门槛大幅降低；其次，这些虚假音视频内容足以以假乱真地骗过大多数“不明真相”的群众；最后，这些带有明显色情、危言耸听或侵犯隐私的信息又足以吸引人，只要从源头传出，就会进行源源不断的扩散。

除了少数能够辨别真伪的专业人士，大多数人都难以分辨和抵制这些假信息的诱惑。深度合成的技术滥用风险，需要得到来自法律、技术、行业、民众等多方面的制约。

第一，法律层面。对AI深度合成内容的用途、标记、使用范围以及滥用技术的处罚，都应该进行深入研究，并出台相应的规定，为深度合成的合法使用提供依据。

第二，技术层面。与深度合成技术同步进化的内容鉴别技术和溯源追踪技术也应该得到重视。针对合成内容的有效鉴别与标记，才能从源头来识别合成内容，以防止负面的虚假内容的扩散。

第三，行业层面。深度合成技术离不开行业自律，合成内容技术提供者和平台要承诺在合成内容之上必须做出标记，或者提供有效的检测和标注工具，来保证合成内容被清晰识别出来。

最后，民众层面。相比较于权威机构或者主流精英人群对合成内容泛滥的担忧，广大民众反而可能是这波“虚拟化”浪潮最主要的支持者，甚至是虚假信息的推波助澜者。

在我们即将全面迎来数字化世界的今天，培养合格“数字素养”应该要成为一件从小就抓起的公民必修课。但这门课教什么、怎么上，仍然需要在深度合成技术发展的路上慢慢探索。

正如没有任何一个技术是我们在做好准备之后才出现，AI技术也是如此。

从一开始，我们就把AI技术出发点定义为，尽可能地学习和模仿人类的能力，以致于最终能够代替人类行驶那些繁重、重复甚至极高难度的任务。

而深度合成技术不正是这一目标的实现过程。我们既然选择唤醒AI这条巨龙，就不能再“叶公好龙”地担心AI越来越像人类这件事情。

最后，反过来看我们人类这个物种，一方面我们有极致的智慧去探索世界的因果规律，始终去探索那个“真相”；一方面我们又抱着极大热情来发明各种工具，来承担人类的各种工作。

这两种能力也直接促成了我们今天的工业世界，以及未来要进入的数字虚拟世界。

乐观来说，我们不仅不用太过担心“后真相时代”的来临，甚至于，我们还会很快适应这个彻底“虚拟化”的美丽新世界。

对于绝大多数人来说，追求真相，远远没有追求舒适更具吸引力。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？的相关文章

Markdown 技能树（8）：代码块

Markdown 技能树 8 代码块行内代码的格式很简单只需要使用两个将代码内容包裹起来即可比如 var foo bar 缩进显示代码要在 Markdown 中创建代码块也很简单只要简单地缩排 4 个空白或是 1 个 tab 就
实现一个函数来计算文件的大小（C语言）

用到的函数 fopen fseek ftell 打开文件 FILE fopen const char pathname const char mode pathname 文件路径可以是绝对路径或相对路径 mode 文件的操作模式可读 o
服务远程调用

文章目录准备工作远程调用运行效果准备工作项目资料链接 https pan baidu com s 1gZMJOBaMqVYSk5kFnRn5kw pwd 5yq5 创建两个数据库分别导入匹配的表 IDEA打开项目修改为自己的
ADSL路由器的设置

关于将ADSL 路由器的设置其实ADSL 路由器的设置并不是很难以TL R4XX系列路由器为例简要说明ADSL 路由器的设置首先MODEM 路由器电脑连结起来网络必需畅通 ADSL 路由器地址出厂默认IP地址 192 168 1
如何获取iPhone手机的UUID

方法一通过Windows下的iTunes 1 数据线连接iPhone手机在Windows下打开iTunes 在 iPhone 管理界面下zhi点击序列号查看自己的 UUID 标识符 2 此dao时点击菜单编辑 gt 复制 3 新建
白盒测试常用工具介绍

白盒测试工具一般是针对代码进行测试测试中发现的缺陷可以定位到代码级根据测试工具原理的不同又可以分为静态测试工具和动态测试工具 1 Jtest 是一个代码分析和动态类组件测试工具是一个集成的易于使用和自动化的Java单元测试工具
js几种生成随机颜色方法
Windows Vista的安装和配置

声明此文章为个人读书笔记仅记些重要的内容备忘无盗版之意更多相关内容请查看 indows Vista使用详解严禁转载第二章 Windows Vista的安装和配置全新安装Windows Vista 从Windows XP升级为W
Text-to-image Diffusion Model文本到图像扩散模型综述

Text to image Diffusion Model文本到图像扩散模型综述论文地址 https arxiv org pdf 2303 07909 pdf 1 Introduction Text to image模型发展如下图所示开
判断字符串是否为数字

不迷迷糊糊直接整代码判断字符串是否是数字判断是否为数字是返回true param str return public static boolean isNumeric final String str null or empty
vue实现鼠标划入划出判断是否显示内容

如图所示我想实现当鼠标划入时右上角的设置图标显示鼠标移出设置图标在隐藏可以通过vue的 mouseenter和 mouseleave事件来实现
Redis事务

7 Redis事务 7 1 背景假如你给你朋友转账此时你的账户会减少1bw 你朋友的账户会多1bw 此时如果你转账失败但是你朋友的账户也多了1bw 此时这对于银行来说这就是事故说明你的程序存在很大漏洞不能保证数据的原子性此时就
通俗讲解c++ future/shared_future

目录 future介绍 std future对象只有在有效的 valid 情况下才有用 useful 查询future对象是否有效 future的拷贝构造函数是被禁用的对future的处理四种方式获取future的状态 future
Qt 提升窗口部件没有效果

1 新建一个控件的子类然后再控件上右键点击提升没有效果原因1 查看提升的控件的类型是否正确原因2 查看提升的子类的路径是否正确如果C 文件跟 pro文件在同一级目录下直接写头文件如果在子目录下要写子目录前面要加原因3 如果
Qt笔记28：QJsonObject和QByteArray的相互转换

brief 字节数组转Json param byteArray return QJsonObject getJsonFromByteArray const QByteArray byteArray QJsonParseError jsonP
2023年我国网络安全人才市场状况

网络安全人才市场状况本章以智联招聘多年来形成的丰富的招聘求职信息大数据为基础结合了奇安信集团在网络安全领域多年来的专业研究经验相关研究成果具有很强的代表性对涉及安全人才的全平台招聘需求与求职简历进行分析注本章中的需求指数采
Android Studio虚拟机启动后没有开机问题解决

这里使用的是Android Studio 3 2版本在Win 10系统上运行其他环境可能会有所不同目录一新增虚拟机二有报错提示时的可能解决办法三无报错提示时的可能解决办法一新增虚拟机 1 打开AVD Manager A
datax导入hive动态分区

配置hive支持动态分区
pandas数据提取

pandas是一个python数据分析库提供了多种方法提取数据一种常用的方法是使用索引和列标签例如 import pandas as pddf pd read csv data csv 获取特定行 row df loc 0 获取特定列
vuepc端实现数据加载_【项目实战经验】vuecli3，实现PC端分辨率适配

vue cli3 根据屏幕大小适配样式最近做了一个大屏考虑到要在不同的显示器上显示同一套代码所以我就想到了阿里的 lib flexible 干货非常多千万不要错过细节哦废话不说直接干 1 安装需要响应的包 npm i lib

随机推荐

【AI实战】大语言模型（LLM）有多强？还需要做传统NLP任务吗（分词、词性标注、NER、情感分类、知识图谱、多伦对话管理等）

AI实战大语言模型 LLM 有多强还需要做传统NLP任务吗分词词性标注 NER 情感分类多伦对话管理等大语言模型大语言模型有多强分词词性标注 NER 情感分类多伦对话管理知识图谱总结大语言模型大语言模型 LLM
IDEA 配置aliyunmaven 仓库地址无法下载依赖jar 包

由于Mavn 默认公共仓库地址是国外的导致下载jar 包比较慢所以推荐使用aliyun maven 仓库镜像编辑setting xml 文件在mirrors节点下新增如下内容我按照百度检索的结果在maven 的setting x
接口测试八（压缩解压）

转自 http www 360doc com content 16 0128 15 30056680 531241550 shtml 一什么是HTTP压缩 HTTP压缩采用通用的压缩算法如gzip等压缩HTML JavaScript或CS
Vue项目创建

1 创建项目在终端中输入命令 vue create 项目名称用以创建项目在命令输入前会有命名提示符提示当前所在目录是哪里输入命令之后等待片刻会出现选择vue版本选择vue2项目 2 配置路由配置路由需要下载依赖库要通过c
常见脚本命令

1 taskkill是Windows命令行里终止指定程序进程的命令 f 表示强制终止 im 表示指定的进程名称例如 explor exe 2 start C Program Files erwin Data Modeler r9 er
MVC发展历程及思想

两种web应用程序的开发模式 model 1 JSP JavaBean JSP负责页面显示页面跳转调用Javabean处理数据处理请求 JavaBean负责数据封装保存数据处理逻辑适用场景 model 1 方式适合开发业务逻辑
android开发：jd-gui的下载和使用

参考 jd gui的下载和使用
常见JS动画效果

作为一名前端开发人员想要的大多都是在开发过程中看着自己制作的动画的炫酷以及困难的解决开发结束后自己的项目成果可以被他人认可接受人们浏览网页时若一个网页动画效果丰富炫酷性能良好体验度良好自然会受到吸引去打来浏览吸引用户
为什么模板不能模板分离编译（模板的定义与声明分离）

目录一什么是分离编译二为什么不能三解决方案 1 模板定义的位置显式实例化 2 将声明和定义放到同一个文件里不让定义和声明分离一什么是分离编译一个程序项目由若干个源文件共同实现而每个源文件单独编译生成目标文件最后将
qt sql 查询正序，倒序

QString str QString SELECT Date Time People Event FROM TB LOG WHERE People 1 order by Date desc limit 0 2000 arg 模式 orde
请你介绍一下map的分类和常见的情况

java为数据结构中的映射定义了一个接口java util Map 它有四个实现类分别是HashMap Hashtable LinkedHashMap 和TreeMap Map主要用于存储健值对根据键得到值因此不允许键重复重复了覆盖
机器学习-线性回归总结

最近学习了线性回归的模型也是机器学习中最基础的一种模型在此总结一下线性回归的模型介绍梯度下降以及正规方程回归问题线性回归顾名思义属于回归问题既然是回归问题那必然属于监督学习在这里简单再介绍一下什么是回归问题回归用于预
Matlab出错向量长度必须相同,代码已贴。错误使用plot3，向量长度必须相同

clc clear all theta 60 半功率角 m log10 2 log10 cosd theta P LED 0 02 nLED 60 P total nLED nLED P LED Ar 1e 4 Ts 1 index 1 5
智能科学工程毕业设计如何选题

文章目录 0 简介 1 如何选题 2 最新智科毕设选题 3 最后 0 简介学长搜集分享最新的智能科学工程与技术业专业毕设选题难度适中适合作为毕业设计大家参考学长整理的题目标准相对容易工作量达标题目新颖 1 如何选题最近非常
【MicroPython RP2040】可编程IOs（PIO）示例介绍

MicroPython RP2040 可编程IOs PIO 原文链接 https www cnx software com 2021 01 27 a closer look at raspberry pi rp2040 programmab
VSCode连接WSL2及VMware，WSL2安装GUI应用

一 VScode 连接WSL2 参考文章巨硬官方文档知乎大佬教程知乎大佬教程2 1 开启WSL2 支持使用管理员权限的 Shell 才能安装 WSL2 按 Win X 找到 Windows PowerShell 管理员并复制执行命
mysql (Errcode: 13 - Permission denied)没有权限找不到文件问题

下午五点钟突然反馈说某个页面报错然后还想让我加班并且很迅速的帮我点了外卖我还打算今晚去健身房呢 1 首先从案发现场勘察页面返回500 2 之后看后台发现某个数据表not found permission denied 3 最后到后
第一次跑高光谱数据结果

1 所用数据集 Bostwana Indian Pines 所用算法 SVM 2 数据分析高光谱数据维数高信息量大冗余信息多这些先都不考虑先输入SVM数据再考虑 3 试验流程加载数据包括Data和label 数据预处理归一化
python Pycharm出现“can't find '__main__' module”解决方案

第一次运行Pycharm工程出现 can t find main module 最后发现原来是配置没配对因为在配置时没有选择 py文件而只选择了工程名因此选择Edit Configurations 选择Edit Configura
从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？

在世人对AI的邪恶性进行攻诘的浪潮中 AI造假可能已经是现在排首位的理由了自从2017年Deepfake 深度伪造横空出世以后人们惊呼原来AI在造假方面简直天赋异禀此后 AI生成内容技术特别是GAN算法的突飞猛进更加印证了

从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？

从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？ 的相关文章

随机推荐

热门标签

从“深度伪造”到“深度合成”：AI为啥需要一次“正名”？的相关文章