DE-FAKE: Detection and Attribution ofFake Images Generated by Text-to-Image Generation Models

2023-11-11

一、文章信息

论文名称:DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models

作者团队:

二、主要创新

本文的主要创新是开发了一种机器学习分类器,用于检测归因文本到图像生成模型生成的虚假图像。

该研究对四种流行的文本到图像生成模型进行了广泛的实验,包括DALL·E 2, Stable Diffusion, GLIDE, and Latent Diffusion,以及两个基准图像数据集MSCOCO和Flickr30k。

实验结果表明,可以将各种模型生成的虚假图像与真实图像区分开来,并且可以有效地将虚假图像归因于其源模型。

三、方法

1、检测,分为纯图像混合检测。

纯图像检测:检测器仅接受图像输入。

混合检测:接受图像和Prompt作为输入。图像与文本编码器均为CLIP的编码器。

 

  •  纯图像检测涉及三个阶段:数据收集、数据集构建和检测器构建。

数据收集:MSCOCO 的 20,000 张图像看作真实图像,并使用SD方法生成20,000张假图像,用于训练探测器,所有其他图像都用于测试探测器的性能。

数据集构建:假的图像标为0,真实图像标为1。

检测器构建:纯图像的使用ResNet18作为检测器。

  • 混合检测同样涉及三个阶段:数据收集、数据集构建和检测器构建

数据收集:与纯图像相同。

数据集构建:由于混合检测器需要图像和提示作为输入,我们标记所有假图像及其对应的提示为0,将真实图像及其对应的提示标记为1。然后我们创建一个训练数据集,总共包含40,000 个提示图像对。

检测器构建:利用了 CLIP 的图像编码器和文本编码器作为特征提取器以获得高级图像和提示的embedding。 然后,我们将图像嵌入和文本嵌入连接在一起作为新的embedding, 并使用这些embedding来训练二元分类器,即 检测器为2 层多层感知器。

实验结果:对于纯图像的检测器,在有些模型上性能良好,有些仅与随机猜想性能相同。但混合检测器对所有模型均表现良好。本质原因是:prompt不能完全反映真实图像的内容,但假图像纯粹是根据提示信息。 这表明假图像与其prompt之间的联系比真实图像与其提示之间的联系更紧密。 且假图像之间有某种共同信息以供检测。

2、归因,分为纯图像混合归因

纯图像归因:仅接受图像输入。

混合归因:接受图像和Prompt作为输入。图像与文本编码器均为CLIP的编码器。

  • 纯图像归因涉及三个阶段:数据收集、数据集构建、归因器构建

数据收集:首先随机抽样 20,000,来自 MSCOCO 的图像作为真实图像。 然后,我们使用这20,000张图像的提示查询每个模型相应地得到 20,000 张假图像。 在这里采用SD、LD 和 GLIDE 生成假图像。 总共获得了 60,000 张假图像。

数据集构建:标记所有真实图像为 0,标记来自SD/LD/GLIDE 为 1/2/3。 然后我们创建一个训练集包含总共80,000 张图像,其中有四个类。

归因器构建:一个接受图像的多类分类器,作为多类预测的输入和输出,即 0-真实、1-SD、2-LD 或 3-GLIDE。利用 ResNet18作为归因器框架。

  • 混合归因涉及三个阶段:数据收集、数据集构建、归因器构建

数据收集:与纯图像归因的数据收集一样

数据集构建:由于我们的混合归因以图像和提示作为输入,我们将所有带有相应提示的真实图像标记为 0,所有假图像来自同一模型及其对应的图像prompt为同一类。 同样,我们然后创建一个训练数据集,包含总共 80,000 个提示图像对,分为四个类别。

归因器构建:利用了 CLIP 的图像编码器和文本编码器作为特征提取器以获得高级图像和提示的embedding。 然后,我们将图像嵌入和文本嵌入连接在一起作为新的embedding, 并使用这些embedding来训练二元分类器,即 检测器为2 层多层感知器。

实验结果:加入prompt的图像归因性能更佳,每个文本到图像生成模型在其生成的假图像中留下了独特的指纹。

  •  什么样的prompt能生成更加真实的图片?

答:与人类相关且prompt长度在25-75之间的prompt能生成更加真实的图片。

  • 最有可能生成真实/虚假的5个prompt。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

DE-FAKE: Detection and Attribution ofFake Images Generated by Text-to-Image Generation Models 的相关文章

  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • Soul App:年轻人的社交状态,还有多少种可能?

    查尔斯 狄更斯在 双城记 的开篇写下 这是最好的时代 这是最坏的时代 这是智慧的时代 这是愚蠢的时代 这是信仰的时期 这是怀疑的时期 人们面前有着各样事物 人们面前一无所有 既然万事万物都和狄更斯所说般 好坏参半 那又何必执着于过去 苦恼于
  • socket网络编程几大模型?看看CHAT是如何回复的?

    CHAT回复 网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型 一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求 不需
  • 什么是充放电振子理论?

    CHAT回复 充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型 这个模型把ENSO现象比喻成一个 热力学振荡系统 在这个模型中 ENSO现象由三个组成部分 充电 Char
  • 基于opencv的大米计数统计(详细处理流程+代码)

    在我每周的标准作业清单中 有一项是编写计算机视觉算法来计算该图像中米粒的数量 因此 当我的一个好朋友M给我发了一张纸上的扁豆照片 显然是受到上述转发的启发 请我帮他数一下谷物的数量时 它勾起了我怀旧的回忆 因此 我在我的旧硬盘上寻找很久以前
  • 毕业设计:基于深度学习的微博谣言检测系统 人工智能

    目录 前言 设计思路 一 课题背景与意义 二 算法理论原理 三 检测的实现 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校要求的毕设项目越来越难 有
  • 无人机视角、多模态、模型剪枝、国产AI芯片部署

    无人机视角 多模态 模型剪枝 国产AI芯片部署是当前无人机技术领域的重要研究方向 其原理和应用价值在以下几个方面进行详细讲述 一 无人机视角 无人机视角是指在无人机上搭载摄像头等设备 通过航拍图像获取环境信息 并进行图像处理和分析 这种技术
  • 台积电再被坑,2纳米光刻机优先给Intel和三星,美国太霸道了

    外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台 三星获得3台 台积电只能得到一台 考虑到美国对ASML的强大影响力 外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面 自从2014年量产14纳米之
  • 作物叶片病害识别系统

    介绍 由于植物疾病的检测在农业领域中起着重要作用 因为植物疾病是相当自然的现象 如果在这个领域不采取适当的护理措施 就会对植物产生严重影响 进而影响相关产品的质量 数量或产量 植物疾病会引起疾病的周期性爆发 导致大规模死亡 这些问题需要在初
  • 2024 人工智能与大数据专业毕业设计(论文)选题指导

    目录 前言 毕设选题 选题迷茫 选题的重要性 更多选题指导 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校要求的毕设项目越来越难 有不少课题是研究生
  • 如何快速申请GPT账号?

    详情点击链接 如何快速申请GPT账号 一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图 图像识别 文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
  • 人工智能 AI 如何让我们的生活更加便利

    每个人都可以从新技术中获益 一想到工作或生活更为便利 简捷且拥有更多空余时间 谁会不为之高兴呢 借助人工智能 每天能够多一些空余时间 或丰富自己的业余生活 为培养日常兴趣爱好增添一点便利 从电子阅读器到智能家居 再到植物识别应用和智能室内花
  • AI帮助终结全球饥饿问题

    全球饥饿问题是牵动人心的头等大事 5月28日是 世界饥饿日 这一问题更值得关注 让人人都能吃饱的想法不仅令人向往 而且很快就会变成现实 与大多数新事物引进一样 对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用 人们还踟蹰不前
  • 【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
  • 考虑光伏出力利用率的电动汽车充电站能量调度策略研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 基于节点电价的电网对电动汽车接纳能力评估模型研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 基于节点电价的电网对电动汽车接纳能力评估模型研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 考虑光伏出力利用率的电动汽车充电站能量调度策略研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 5_机械臂运动学基础_矩阵

    上次说的向量空间是为矩阵服务的 1 学科回顾 从科技实践中来的数学问题无非分为两类 一类是线性问题 一类是非线性问题 线性问题是研究最久 理论最完善的 而非线性问题则可以在一定基础上转化为线性问题求解 线性变换 数域 F 上线性空间V中的变
  • 实力认证!鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

    近日 由中国科学院软件研究所 中科软科技股份有限公司联合主办的 2023中国软件技术大会 于北京成功举办 本届大会以 大模型驱动下的软件变革 为主题 数十位来自知名互联网公司和软件巨头企业的技术大咖 不同领域行业专家 畅销书作者等分享嘉宾

随机推荐

  • windows向linux传送文件

    windows与Linux之间传送文件 1 用putty的内置小组件PSCP exe 此法可行 pscp exe 可从putty官方下载 然后放到 windows 的c windows system32目录下 这样cmd 命令提示符窗口 输
  • linux下使用ffmpeg录屏

    linux系统中 使用ffmpeg进行录屏与截图 把 dev fb0设备的framebuffer显示图像录制为视频 ffmpeg f fbdev framerate 10 i dev fb0 out avi 编码帧率默认值为25fps 把
  • Android查看应用签名方法

    查看keystore文件签名 查看keystore文件签名信息 前提要有keystore文件和密钥 才能够获取keystore文件的签名信息 打开 AS工具窗口栏右边的 Gradle gt Project gt app gt Tasks g
  • QtCreator设置多个qmake

    qt Creator 有时候需要设置不同qt库文件 也就是不同qmake 我们可以设置 1 Tools gt KIts 然后选择Manual gt add 然后添加Name写5 15或者其它名字 然后点击Qt Version gt Manu
  • PID算法(没办法完全理解的东西)

    快速 P 准确 I 稳定 D P Proportion 比例 就是输入偏差乘以一个常数 I Integral 积分 就是对输入偏差进行积分运算 D Derivative 微分 对输入偏差进行微分运算 输入偏差 读出的被控制对象的值 设定值
  • 24. 二叉搜索树的最近公共祖先

    题目链接 235 二叉搜索树的最近公共祖先 大概思路 题目要求 给定一颗二叉搜索树 两个确定值q p 要求q p的最近公共祖先 思路 利用搜索树的特性 当q p的值均小于遍历的节点值的时候 可以判断q p均在根节点的左子树上 小于则在右子树
  • DUKE大学BOE数据集 OCT图像积液分割数据集

    使用此数据集用来做积液分割研究 地址 http people duke edu sf59 Chiu BOE 2014 dataset htm 使用python将 mat转换为图片格式 对BOE MAT格式文件处理成图片 import cv2
  • 数据生成

    数据生成 MATLAB实现MCMC马尔科夫蒙特卡洛模拟的数据生成 目录 数据生成 MATLAB实现MCMC马尔科夫蒙特卡洛模拟的数据生成 生成效果 基本描述 模型描述 程序设计 参考资料 生成效果 基本描述 1 MATLAB实现MCMC马尔
  • java常见轮询算法

    轮询算法 轮询算法就是通过一个算法 对提供的一组列表进行计算 按照一定规则取出列表中的元素 常见的有顺序模式 随机模式 加权模式 加权平滑模式 定义轮询算法的接口 轮询算法接口 public interface Balance
  • 计费服务器不响应,按小时计费的服务器不开机会计费吗

    按小时计费的服务器不开机会计费吗 内容精选 换一换 按需付费是后付费方式 可以随时开通 删除弹性云服务器 支持秒级计费 系统会根据云服务器的实际使用情况每小时出账单 并从账户余额里扣款 按需付费的弹性云服务器关机再次开机时 可能会出现由于资
  • NMOS作为开关的两种接法

    NMOS作为开关的两种接法 1 左边电路负载是接在S极对地 如果R1很小且Q1 G极一直为High 那么流过Q1的电流可能将会非常大 MOS管容易烧 2 R1 I Us VGS Vg Vs 此时VGS不一定会大于Vgs th MOS会不完全
  • html抽奖概率,求一个可挑概率的html5抽奖 圆盘的

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼圆盘抽奖 margin 0 padding 0 elm1 height 40px background color a00 elm2 height 50px background color 0a
  • mysql库的安装

    编译文件时找不到mysql库 使用以下命令查看是否安装mysql库 dpkg l grep libmysqlclient dev 安装 sudo apt get install libmysqlclient dev 安装完成可以正常编译
  • Parallels Desktop 17 发布 针对M1大幅优化

    今天 Parallels 公司发布了 Parallels Desktop 17 它对 Windows 11 和 macOS Monterey 进行了适配优化 同时为基于Apple M1 和Intel 芯片的Mac进行图形 性能提升和生产力的
  • 【.NET8】访问私有成员新姿势UnsafeAccessor(上)

    前言 前几天在 NET性能优化群里面 有群友聊到了 NET8新增的一个特性 这个类叫 UnsafeAccessor 有很多群友都不知道这个特性是干嘛的 所以我就想写一篇文章来带大家了解一下这个特性 其实在很早之前我就有关注到这个特殊的特性
  • Windows 常用运行库下载 (DirectX、VC++、.Net Framework等)

    经常听到有朋友抱怨他的电脑运行软件或者游戏时提示缺少什么 d3dx9 xx dll 或 msvcp71 dll msvcr71 dll又或者是 Net Framework 初始化之类的错误而无法正常使用 其实很多时候 只是因为你的电脑没有安
  • kettle8 新插件开发 调试

    参考 https blog csdn net u013468915 article details 82629810 https blog csdn net zougen article details 80825751 基于eclipse
  • 【自然语言处理】大模型高效微调:PEFT 使用案例

    文章目录 一 PEFT介绍 二 PEFT 使用 2 1 PeftConfig 2 2 PeftModel 2 3 保存和加载模型 三 PEFT支持任务 3 1 Models support matrix 3 1 1 Causal Langu
  • 从新建项目到打包成APK(Cocos2d-x 2.2.1)

    好久没有更新Cocos2d x的学习文章了 最近在整理大学期间做过的东西 同时也新做了几个Cocos2d x的小程序 并且在网上搜索了不少资料 终于成功地打包成APK了 并在两个Android手机上成功运行 小for的环境是Windows8
  • DE-FAKE: Detection and Attribution ofFake Images Generated by Text-to-Image Generation Models

    一 文章信息 论文名称 DE FAKE Detection and Attribution of Fake Images Generated by Text to Image Generation Models 作者团队 二 主要创新 本文