AE/VAE/DDPM

2023-11-20

Docshttps://laiye-tech.feishu.cn/docx/XRKldiRcZoMDomxwrKtcWD8EnQb 基于Diffusion的典型可控图片生成模型在上文扩散模型原理的基础上，本文对目前最前沿的几个可控图像生成模型如DALL-E-2，ImaGen，Stable Diffusion做了详细介绍。https://mp.weixin.qq.com/s/qJweKUrwLcOjXQatE3VHlQ diffusion model 最近在图像生成领域大红大紫，如何看待它的风头开始超过 GAN ？ - 知乎最近在做和扩散模型相关的项目，希望边学习边探索，能圆满完成这个工作。DDPM (NeurIPS-20)DDPM正向的扩…https://www.zhihu.com/question/536012286/answer/2516184924 diffusion model 最近在图像生成领域大红大紫，如何看待它的风头开始超过 GAN ？ - 知乎更新：我在第4章增加了离散时间的diffusion model的最新研究进展，欢迎大家关注！======================…https://www.zhihu.com/question/536012286/answer/2533146567

通过AE模型可以看到，只要有有效的数据的Latent Attribute表示，那么就可以通过Decoder来生成新数据，但是在AE模型中，Latent是通过已有数据生成的，所以没法生成已有数据外的新数据。

所以我们设想，是不是可以假设Latent 符合一定分布规律，只要通过有限参数能够描述这个分布，那么就可以通过这个分布得到不在训练数据中的新Latent ，利用这个新Latent就能生成全新数据，基于这个思路，有了VAE（Variational AutoEncoder 变分自编码器）

图片的上面部分是去噪，上面部分是加噪。

1.前向加噪

加噪过程就是简单的变分后验过程。

2.后向去噪

常见的DDPM都是unet实现的。

这里的扩散的思路和vae是一致的，vae通过变分后验（学出来的）将样本数据转到高斯分布，再通过生成器将高斯分布转到生成样本，扩散的核心思路就是通过一种简单的变分后验将样本转到高斯，再慢慢一步一步的将高斯转到原始数据空间，一种简单的变分后验对应的就是去噪过程，生成器的一步一步扩散对应的就是加噪过程，无参的加噪过程非常容易，把数据分布映射到高斯分布非常容易，我们只需要构造一个平稳分布是标准高斯分布的马尔科夫链即可。我们可以适当构造马尔科夫链，使得不管从什么分布出发，沿着马尔科夫链一致采样下去最终可以得到某个你想要的平稳分布。

使用DDPM的时候，我们依然希望可以通过条件控制生成，如前边提到的DALLE-2，Stable Diffusion都是通过条件（文本prompt）来控制生成的图像，为了实现这个目的，就需要采用Conditional Diffusion Model。

目前主流的condition diffusion model主要有两种实现方式，classifier-guidance和classifier-free，前者需要一个分类模型，后者无须分类器模型。分类器模型对前向过程融入噪音的数据很好的分类，在扩散模型求梯度的阶段，融入这个分类模型对当前噪音数据的梯度即可。free就是对特征学习一个embedding表示，然后采样性的加入unet的encoder的阶段。

后续的几篇文章包括：

DDIM：

classifier-free guidance diffusion

Glide

Dalle-1

Dalle-2

Imagen

ldm

controlnet

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AE/VAE/DDPM 的相关文章

用CHAT如何写大学生会计综合模拟实训报告

CHAT回复标题大学生会计综合模拟实训报告一前言随着信息化时代的发展现代会计工作不再只依赖手动运算和记录而是更加倚重电脑软件系统的配合运用因此对我们大学生来说把握会计理论知识的同时积极掌握相关的实践应用技能变得非常重要
毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
利用CHAT写实验结论

问CHAT 通过观察放置在玻璃表面上的单个水滴人们可以观察到水滴充当成像系统探究这样一个透镜的放大倍数和分辨率 CHAT回复实验报告标题利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率一实验目的通过对比和测量研究和探索玻
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

利用Java EE相关技术实现一个简单的Web聊天室系统

利用Java EE相关技术实现一个简单的Web聊天室系统 1 编写一个登录页面登录信息中有用户名和密码分别用两个按钮来提交和重置登录信息 2 通过请求指派来处理用户提交的登录信息如果用户名为本小组成员的名字且密码为对应的学号时跳转到
Windows PowerShell初始化conda后（init conda）速度变慢，如何关闭？

方法1 conda config set auto activate base false 结果 Windows PowerShell 在开启后不会激活conda base 环境但开启速度仍然比原先很慢 gt 1000ms 方法2 在 C
coc安装插件报错 “unable to verify the first cetificate”

通过 CocCconfig 打开coc settings json增加一个配置 http proxyStrictSSL false 参考 https github com neoclide coc nvim issues 1514 issu
cd mysql 权限不够_Mysql 8.x初次安装过程中遇到MySQL 服务无法启动的解决方法

小白测试个软件需要安装MySQL 第一次就遇到MySQL服务无法启动等一些问题经过多方搜索尝试初次安装并修改密码过程如下文章中大写MySQL代表MySQL数据库软件自身小写mysql8代表作者MySQL数据库软件解压后的文件路径
华为交换机限速配置命令2016

qos lr cir 1024 cbs 20048 1 华为s2300交换机如何配置端口限速使用QOS命令来配置网络带宽的10M 100M和1000M的单位是bps 即bit s 位秒而我们通常所说的100M大小的文件这里的单位是
关于面试总结13-app测试面试题

前言现在面试个测试岗位都是要求全能的 web 接口 app啥都要会测那么APP测试一般需要哪些技能呢面试app测试岗位会被问到哪些问题怎样让面试管觉得你对APP测试很精通的样子本篇总结了app测试面试时候经常被问的10个相关问题
解决深度下外接显示屏调整屏幕分辨率的问题

将以下命令粘贴进去即可 cvt 1366 768 60 1368x768 59 88 Hz CVT hsync 47 79 kHz pclk 85 25 MHz Modeline 1368x768 60 00 85 25 1368 1440
数据库概论笔记第五章（ER模型）

E R模型 1 建立模型数据库可以被定义为实体的集合和实体间的关系实体集相同类型的实体的集合属性类型实体集都拥有的描述性的属性域domain 每个属性允许值的集合简单simple属性不可分割的属性复合composite属性
sqlServer将一个表中的字段更新到另一个表中

将表2 中 evaluate 字段更新到表1 UPDATE dbo 表1 SET evaluate c evaluate FROM dbo 表2 c dbo 表1 i WHERE c id i indexId
vue 权限按钮显示隐藏 (组件法)

咱们做后台管理系统肯定避免不了权限菜单权限按钮的显示与隐藏我分享一下我的实现创建一个权限显示隐藏的公共组件
Android TabLayout设置选中状态标题字体大小,粗细

最全Tablayout详解https blog csdn net yechaoa article details 122270969 布局文件
分享5个免费、高清、无版权视频素材网站，果断收藏！

现在各种短视频和自媒体是越来越火了创作者们对于自己作品的版权也愈发重视稍不留神你的视频可能就侵权了例如使用未经授权的视频素材都是会涉及到侵权的其实现在有很多无版权的视频素材网站可以满足大家一定的创作需求下面给大家分享5个免费
前端vue实现分页功能

前端Vue实现分页功能我们都知道在spring boot项目中安装pagehelper可以实现分页功能但是在vue中也能在前端实现分页 1 首先在data中定义以下变量 data return list null listLoadin
【spring aop】连接点(Jointpoint)、切入点(Pointcut)、增强(Advice)、方面/切面(Aspect、Advisor)

文章目录前言 1 先来回顾一下AOP中的一些术语 2 增强方式简介 2 1 MethodBeforeAdvice前置增强 2 2 AfterReturningAdvice后置增强 2 3 ThrowsAdvice异常增强 2 4 Meth
Unity3d Terrain地形制作系列（一）

游戏简单地形地形制作地形制作第一步在场景里加载一个地形对象第二步我们在属性面板里找到绘制地形然后选择Set Height 绘制高度应该我们要制作低凹的效果所有先让他有个高度不然是不能实现低凹的效果如图我们然后选择绘制地
Node.js安装及环境配置（简单易懂全面！）

参考 https www cnblogs com liuqiyun p 8133904 html https www jianshu com p 13f45e24b1de 目录一安装环境二安装Node js步骤三前期准备四开
球迷如何在Linux纯命令行玩转谷歌浏览器，边看欧洲杯，边看足球宝贝

大家好我是Lex 喜欢欺负超人那个Lex 擅长领域 python开发网络安全渗透 Windows域控Exchange架构今日重点 1 Linux骚操作纯命令行玩转GoogleChrome浏览器 2 在Linux命令行打开足球宝贝的搜
stm32f103中断函数配置

一配置中断优先级NVIC 1 初始化中断结构体在misc h中找到 NVIC InitTypeDef 这个结构体并定义 2 中断优先级分组在misc c文件里找到 void NVIC PriorityGroupConfig uint32
U-Boot启动过程完全分析

1 1 U Boot工作过程 U Boot启动内核的过程可以分为两个阶段两个阶段的功能如下 1 第一阶段的功能硬件设备初始化加载U Boot第二阶段代码到RAM空间设置好栈跳转到第二阶段代码入口 2 第二阶段的功能初始化本阶段使
AE/VAE/DDPM

Docshttps laiye tech feishu cn docx XRKldiRcZoMDomxwrKtcWD8EnQb基于Diffusion的典型可控图片生成模型在上文扩散模型原理的基础上本文对目前最前沿的几个可控图像生成模型如D

AE/VAE/DDPM

AE/VAE/DDPM 的相关文章

随机推荐

热门标签