VAE，变分

2023-11-06

1. Latent Variable Model

生成模型一般会生成多个种类的数据，比如说在手写数字生成中，我们总共有10个类别的数字要生成，这个时候latent variable model就是一个很好的选择。

为什么呢？举例来说，我们很容易能注意到相同类别的数据在不同维度之间是有依赖存在的，比如生成数字5的时候，如果左边已经生成了数字5的左半部分，那么右半部分就几乎可以确定是5的另一半了。

因此一个好的想法是，生成模型在生成数字的时候有两个步骤，即(1)决定要生成什么数字，这个数字用一个被称为latent variable的向量z来表示，(2)然后再根据z来直接生成相应的数字。用数学表达式来表示就是：

这就是所谓的latent variable model。

我们要介绍的VAE就是latent variable model的一种，我们将会看到，VAE可以利用BP算法来快速训练，且不需要对latent code的prior有任何知识，所有你需要的只是一个简单的encoder-decoder模型。也正是因为吸收了深度学习时代的众多技术优势，才使VAE变成了一个广受欢迎的生成模型。

2. VAE

2.1 latent variable

要解式(1)，就必须决定P(z)，然而latent variable z的prior是很难决定的，尤其是在深度学习背景下的生成模型，其生成的数据动辄上百维度，因此数据中就会存在大量依赖。

VAE是怎么解决这个问题的呢？它没有对z做出任何假设，而是说任何z的sample都可以从一个最简单的高斯分布来得到，即均值为0，协方差为单位矩阵的高斯分布。

你可能会觉得很奇怪，这是为什么呢？其实这里最关键的是注意到任何d维分布都可以从一个d维高斯分布+一个足够复杂的函数映射得到，比如我们可以把一个2维高斯分布映射成环型：

因此，只要有足够强力的函数估计器，我们就可以获得任何分布的latent variable z。很容易就可以想到用神经网络来构建这个函数估计器。

接下来的问题是，如何最大化(1)式？

2.2 The objective

有了z的prior，我们很容易想到利用多次采样的方式来最大化likelihood：

然而这种方法非常低效，特别是当z在高维空间的时候。

那么VAE是怎么解决这个问题的呢？

首先我们需要注意到，几乎所有的P(X|z)都是接近于0的，因为既然X是只有有限个类数据，那么z就应该有特定的值，因此我们要做的就是只用那些最有可能生成X的z来训练。这个时候我们就需要一个新的函数用来生成X对应的latent variable distribution：

这个Q让我们可以计算

而不是z是高斯分布时候的期望，这就减少了计算量。然而，虽然这样很好，但是上式和P(X)又有什么关系呢？别忘了我们最终的目的是最大化P(X)，因此这里我们就需要把这两个式子联系起来。

这里KL散度是一个比较好的选择，因为它刻画了两个分布之间的距离：

我们用贝叶斯公式来分解右边的P(z|X)：

移项，两边乘-1就得到：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AIGC图像

人工智能

VAE，变分的相关文章

扬帆证券：产业化破题在即人形机器人超预期演进

大模型助力下的拐点特斯拉A股产业链上两笔重磅出资几乎一起现身总规划超百亿元 1月4日拓普集团公告与宁波经济技能开发区办理委员会签署了机器人电驱系统研发生产基地项目出资协议书公司拟出资50亿元建设机器人核心部件生产基地此次出
文档扫描与矫正-仿射变换

图像变换是计算机视觉和图像处理中的关键技术之一它允许我们对图像进行各种形式的变形调整和校正其中仿射变换是一种常见的变换方式在文档扫描过程中由于拍摄角度和畸变等原因文档图像可能存在一定程度的形变仿射变换可以用于校正文档图像使
欧盟反垄断主管即将会见库克，iPhone NFC功能要开放了？

1月5日路透社报道欧盟反垄断主管玛格丽特维斯塔格 Margrethe Vestager 即将在下周举办会议会见苹果博通英伟达等多个科技公司CEO 苹果首席执行官蒂姆库克 Tim Cook 就在其中欧盟反垄断想来大家应该已经不陌
2024年华数杯国际赛B题：光伏发电功率思路模型代码解析

2024年华数杯国际赛B题光伏发电功率 Photovoltaic Power 一问题描述中国的电力构成包括传统能源发电如煤油和天然气可再生能源发电如水电风能太阳能和核能以及其他形式的电力这些发电模式在满足中国对电力的巨
用通俗易懂的方式讲解：如何用大语言模型构建一个知识问答系统

传统搜索系统基于关键字匹配在面向游戏攻略技术图谱知识库等业务场景时缺少对用户问题理解和答案二次处理能力本文探索使用大语言模型 Large Language Model LLM 通过其对自然语言理解和生成的能力揣摩用户意图并对
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
主流进销存系统有哪些？企业该如何选择进销存系统？

主流进销存系统有哪些企业该如何选择进销存系统永久免费的软件这个可能还真不太可能有而且就算有也只能说是相对免费因为要么就是数据存量有限要么就是功能有限数据信息都不保障并且功能不完全免费免费软件免费进销存诸如此类
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾

随机推荐

Git 代码分支管理

作者京东科技周新智一引言近日 IoT 研发团队加入了不少新同学对 git 分支的命名和管理方式有些许的模糊分支的命名规范以及管理方式对项目的版本发布至关重要为了解决实际开发过程中版本发布时代码管理混乱冲突等比较头疼的问题
小程序之100推荐：901~1000

2019独角兽企业重金招聘Python工程师标准 gt gt gt 901 Oyes视频 Oyes视频小程序简介一个妈妈专属的视频精选请至极乐小程序商店搜索 Oyes视频微信扫码即可体验 902 银如意资讯银如意资讯小程序简介银如
Mysql Server原理简介

Mysql客户端包括JDBC Navicat sqlyog 只是为了和mysql server建立连接向mysql server提交sql语句 mysql server组件第一部分叫连接器主要承担的功能叫管理连接和验证权限每次在进行
缓存穿透、缓存击穿、缓存雪崩的问题与解决方案

缓存概念在计算器中高速缓冲存储器是一个硬件或软件组件其存储数据以便该数据可以在将来的请求送达更快存储在缓存中的数据可能是早期计算的结果也可能是存储在其他位置的数据的副本一个缓存命中时所请求的数据在高速缓存中找到而出现高速缓
还不知道off-heap堆外内存？安排～

目录 on heap堆内内存是什么 JVM堆内存是如何划分的 JVM堆内存满了后会怎么样基于堆外内存解决系统GC卡顿问题今天给大家聊一个很有意思的知识就是off heap堆外内存平时出去面试或者研究一些技术的时候经常可能会遇到o
一个简单的实习生管理系统

写了一个简单的实习生管理系统用于自己复习java后端由于是复习java为目的故而这个系统没有用框架 control层基本手写servlet完成基本的增删改查级联删除功能均有实现适合java刚入门的同学阅读大神们请别见笑如有错
教你用OpenCV 和 Python实现圆物检测

点击上方码农的后花园选择星标公众号精选文章第一时间送达基于python使用OpenCV实现在一张图片中检测出圆形并且根据圆检测结果信息绘制标记出圆的边界和圆心 1 HoughCircles 霍夫圆检测函数在Opencv
告诉你个秘密(ISCCCTF)(Crypto--bugku)

观察一下有A E B 没有其他字母猜测是十六进制转字符还是字符串有大写小写数字猜测还有加密然后各种解密都尝试一下 emem 是base64 四个一组三个一组哈哈键盘密码对的就是键盘加密被包围的字母就是flag 提
最常用激活函数公式（更新中）

最常用激活函数公式如需转载请务必标明出处及作者信息洋石灰儿 https blog csdn net Yshihui article details 80540070 1 what and why 直观的作用就是进行非线性操作将输入信
Linux服务器clang-13安装（环境变量配置）

1 从llvm的github网址选择合适的release合适的运行平台进行下载下载官方预编译的二进制压缩包 2 将下载好的压缩包进行本地上传使用scp命令进行上传 scp r P 端口号本地文件路径服务器ID等服务器上目标地址 3
九大内置对象

1 request对象 request 对象是 javax servlet httpServletRequest类型的对象该对象代表了客户端的请求信息主要用于接受通过HTTP协议传送到服务器的数据包括头信息系统信息请求方式以及请求
Fastadmin,配置SMTP邮件,踩坑笔记

phpmailer php做发送邮件有个叫phpmailer的插件而fastadmin正是用的这一插件首先是准备工作你要把你的qq邮箱设置一下开启SMTP邮件 qq邮箱的设置位置在账户账户这一选项下这里如果你手机绑定了qq安
web服务器性能测试,主流web服务器性能测试

前言因为boss要一个并发能上W得平台而且还是要PHP得恩好吧我是不喜欢php的但是没办法谁叫PHP是世界上最好得语言呢于是心血来潮来了一组 web服务器性能测试测试有 php7 fpm docker nginx jav
【华为OD机试真题 Java】小组卡片最大数字（100%通过+全网最详细注释）

前言本专栏将持续更新华为OD机试题目并进行详细的分析与解答包含完整的代码实现希望可以帮助到正在努力的你关于OD机试流程面经面试指导等如有任何疑问欢迎联系我 wechat steven moda email nansun09
win10开始菜单打不开，使用startmenu.diagcab进行修复

win10开始菜单打不开使用startmenu diagcab进行修复下载后打开运行startmenu diagcab 打开后点击高级选项勾选自动修复应用措施接着点击下一步运行修复后点击查看详细信息查看打不开的原因进行下一步
hk pic.net forum.php,HC-SR04 problem with pic18f24k22.

2021 03 26 00 11 57 proestpa Hello I have a problem with HCSR04 ultrasonic distance sensor I wrote a code that works per
记一次蓝屏的解决，错误代码IRQL_NOT_LESS_OR_EQUAL

这两天不知为何电脑总是正在运行时自动重启今天忍无可忍百度了一下解决方法有方法说我的电脑右键属性高级启动和故障恢复中的设置系统失败中取消勾选自动重新启动能解决问题所以就先照做了如下图不设置还好没想到一设置重
2021蒙城高考成绩查询,2021亳州高考成绩查询入口

今年的高考已经和大家告一段落想必考生和家长们现在比较关注的就是高考成绩查询了下面出国留学网小编给大家分享 2021亳州高考成绩查询入口仅供参考希望帮助各位考生便捷查询高考成绩祝大家考个好成绩 2021安徽高考成绩查询时间 2021
cmd命令安装python第三方库_Python如何安装第三方库

Python如何安装第三方库版权申明非商业目的注明出处可自由转载博文地址 https blog csdn net cdpxc article details 108808780 出自 cdpxc 注笔者是在D盘直接安装了Anacon
VAE，变分

1 Latent Variable Model 生成模型一般会生成多个种类的数据比如说在手写数字生成中我们总共有10个类别的数字要生成这个时候latent variable model就是一个很好的选择为什么呢举例来说我们很容易