变分推断的数学推导

2023-11-13

这里只给出变分推断的数学推导（变分颇为高深，这里只是简单介绍一下基本概念，想了解更多详见：https://blog.csdn.net/weixin_40255337/article/details/83088786）：

变分推断的目的是构造 q ( w ∣ θ ) q(w| \theta) q(w∣θ) ，通过优化得到最优的 θ*，从而使得 q(w| θ) 逼近未知的后验分布 P(w |X)。

由贝叶斯公式可知：
P ( X ) = P ( X , w ) P ( w ∣ X ) P(X) = \frac{P(X,w)}{P(w | X)} P(X)=P(w∣X)P(X,w)
等式两边取对数：
log ⁡ P ( X ) = log ⁡ P ( X , w ) − log ⁡ P ( w ∣ X ) \log P(X) = \log P(X, w) - \log P(w |X) logP(X)=logP(X,w)−logP(w∣X)
等式右侧 + log ⁡ q ( w ∣ θ ) +\log q(w| θ) +logq(w∣θ) 再 − log ⁡ q ( w ∣ θ ) - \log q(w | θ) −logq(w∣θ)：
log ⁡ P ( X ) = log ⁡ P ( X , w ) q ( w ∣ θ ) − log ⁡ P ( w ∣ X ) q ( w ∣ θ ) \log P(X) = \log \frac{P(X, w) }{q(w| θ)} -\log \frac{P(w | X)}{q(w | θ)} logP(X)=logq(w∣θ)P(X,w)−logq(w∣θ)P(w∣X)
等式两侧对 w w w（服从分布 q ( w ∣ θ ) q(w| \theta) q(w∣θ)）取期望，由于等式左侧与 q ( w ∣ θ ) q(w| \theta) q(w∣θ) 无关，因此有：
log ⁡ P ( X ) = E [ log ⁡ P ( X ∣ w ) + log ⁡ P ( w ) − log ⁡ q ( w ∣ θ ) ] + E [ log ⁡ q ( w ∣ θ ) P ( w ∣ X ) ] \log P(X) = \mathbb{E} \big[ \log P(X | w) + \log P(w) - \log q(w| \theta) \big] + \mathbb{E} \Bigg[ \log \frac{q(w| θ)}{P(w| X)} \Bigg] logP(X)=E[logP(X∣w)+logP(w)−logq(w∣θ)]+E[logP(w∣X)q(w∣θ)]

等式左侧为定值，右侧第一项为定义为ELBO，第二项为 K L { q ( w ∣ θ ) ∣ ∣ P ( w ∣ X ) } KL\{q(w| θ) || P(w| X)\} KL{q(w∣θ)∣∣P(w∣X)}，即：
E L B O + K L { q ( w ∣ θ ) ∣ ∣ P ( w ∣ X ) } = C o n s t a n t ELBO+ KL\{q(w| θ) || P(w| X)\} = Constant ELBO+KL{q(w∣θ)∣∣P(w∣X)}=Constant
因此 arg ⁡ min ⁡ θ K L { q ( w ∣ θ ) ∣ ∣ P ( w ∣ X ) } = arg ⁡ max ⁡ E L B O \arg \min_\theta KL\{q(w| θ) || P(w| X)\} = \arg\max ELBO argminθKL{q(w∣θ)∣∣P(w∣X)}=argmaxELBO。
论文原文中的ELBO还有另一种形式：
E B L O = E [ log ⁡ P ( X ∣ w ) + log ⁡ P ( w ) − log ⁡ q ( w ∣ θ ) ] = E [ log ⁡ P ( X ∣ w ) ] − E [ log ⁡ q ( w ∣ θ ) P ( w ) ] = ∫ q ( w ∣ θ ) log ⁡ P ( X ∣ w ) d w − K L { q ( w ∣ θ ) ∣ ∣ P ( w ) } \begin{aligned} EBLO &= \mathbb{E} \big[ \log P(X | w) + \log P(w) - \log q(w| \theta) \big] \\ &= \mathbb{E} \big[ \log P(X | w) \big] - \mathbb{E} \Bigg[ \log \frac{q(w| \theta)}{P(w)} \Bigg] \\ &= \int q(w | \theta) \log P(X | w) dw - KL\{ q(w| \theta) || P(w) \} \end{aligned} EBLO=E[logP(X∣w)+logP(w)−logq(w∣θ)]=E[logP(X∣w)]−E[logP(w)q(w∣θ)]=∫q(w∣θ)logP(X∣w)dw−KL{q(w∣θ)∣∣P(w)}

而对于一个深度学习问题，给定数据集D，神经网络的参数为 w w w，输出为 P ( D ∣ w ) P(D | w) P(D∣w)。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

变分推断的数学推导的相关文章

【华为OD机试 2023】查找单入口空闲区域（C++ Java JavaScript Python）

华为od机试题库华为OD机试2022 2023 C Java JS Py https blog csdn net banxia frontend category 12225173 html 华为OD机试2023最新题库更新中 C Ja
npm安装依赖至指定版本的方法

简介本文介绍npm安装依赖至指定版本的方法依赖的版本可以在淘宝镜像或官方查询到三种方法方法一先在package json里修改好指定版本号然后输入 npm update webpack 方法二 npm update webpac
【从推理出发】

赌上爷爷之名 2021年暑假和现在一样也是很佛不想好好学习的时间 8月的天气太过炎热有时却又暴雨倾盆很不讨喜只得在家闲着看电视动漫打发时间按照以前的习惯一般是悠闲地躺在沙发上吹着空调看着长达900多集的柯南然后在剧情中
spring cloud gateway 自定义负载均衡

spring cloud gateway 自定义负载均衡相关类及接口 LoadbalancerClientFilter 使用ribbon负载均衡默认使用该类已不推荐使用 deprecated Deprecated public cla
伙计，Go项目怎么使用枚举？

前言哈喽大家好我是asong 枚举是一种很重要的数据类型在java C语言等主流编程语言中都支持了枚举类型但是在Go语言中却没有枚举类型那有什么替代方案吗本文我们来聊一聊这个事情为什么要有枚举我们以java语言为例子在J
R语言实现可理解的随机森林模型（Random Forest）——iml包

Random Forest 解释模型 1 介绍 2 理解随机森林运行机理 2 1导入需要的包 2 2 构建随机森林模型 2 3 RF特征重要性 2 4 特征对预测结果的影响 2 5 交互作用 2 6 替代模型 Decision tree s
微信小程序View视图容器组件

完整微信小程序 Java后端技术贴目录清单页面必看微信小程序框架为开发者提供了一系列完备的UI组件方便开发者快速构建小程序UI界面借助这些UI组件开发者可以像搭积木一样快速地拼装出一栋房子的样子这非常类似于当下建筑行业比较流行的
华为ERP思考：国产自研迈出第一步

华为的进入会刺激用友金蝶浪潮等国产厂商加快技术革新以及伴随着华为自身技术自研全栈的布局和不断测试国产ERP的兼容性和标准性都将上一个新的台阶作者斗斗编辑皮爷出品产业家 15小时完成全球88家子公司Meta ERP系统的切
java正则表达式工具类_java正则表达式工具类详解

主要功能有 boolean find 是否能匹配到至少一个 boolean match 匹配整个字符串这个方法其实可以用做到 int size 匹配的字符串个数 String getAll 获取所有匹配到的字符串 String get
浏览器滚动到底部页面加载问题

问题描述页面在m端展示的时候滚动到底部应该自动加载下一页但是却没有解决办法在有些浏览器滚动下滚动时滚动到底部仍然不会触发一般的底部加载事件的条件可以在距离底部有一定距离时进行滚动加载事件的触发 if windowHeight
教你们怎么找到已失效的百度网盘资源

这是飓风在暴走吧友的分享链接已经失效了在这条链接的最后我们可以看到一行数字 304927434 接下来就是最重要的一步了 pan baidu com share home uk 上面那个链接的等于号后加上我们刚才上面那个链接的数字打开
PyCharm 连接 SQLSever

说实在的能遇到的错误差不多都遇到了学生小白自己搞有点困难不得不说新的错误一个接一个真的很崩溃qvq 在查阅参考各位大佬的文章及一些知识的相关资料最终完成连接若有不足之处望各位大佬指正目录 1 数据库无法连接服务器 2 检测自己的
2023年华数杯数学建模C题母亲身心健康对婴儿成长的影响解题全过程文档及程序

2023年华数杯全国大学生数学建模 C题母亲身心健康对婴儿成长的影响原题再现母亲是婴儿生命中最重要的人之一她不仅为婴儿提供营养物质和身体保护还为婴儿提供情感支持和安全感母亲心理健康状态的不良状况如抑郁焦虑压力等可能会对婴
hadoop完全分布式集群的配置

简介我这里配置的完全分布式集群使用的hadoop用户所以在之前必须创建一个hadoop用户上传hadoop的jar包然后再继续使用我接下来完全分布式的配置方法如果在配置的过程当中出现了什么问题欢迎博友提出来我们一起讨论解决问
线性代数学习笔记——第十八讲——抽象矩阵的可逆性

1 矩阵可逆性的相关定理引理和推论 2 求逆矩阵示例1 3 求逆矩阵示例2 4 分块矩阵的逆矩阵的求解示例 5 分块对角矩阵可逆的充分必要条件 6 逆矩阵的应用示例
Unchecked cast: java.lang.Object to java.util.List问题的解决

文章目录 1 问题的代码 2 出现的问题 3 问题的解决方式一使用 SuppressWarnings unchecked 忽略问题方式二正确的方式方式三将方式二封装为工具类使用方式四使用Fastjson转换格式方式五使用
如何解决vue/react打包上线之后路由页面刷新就丢失的问题

location try files uri index html index index html index htm index php 通过服务器的nginx配置进行url重写到程序入口index html 代码如上
【系统设计与实现】智慧教室在线监考系统，实时视频推理(vue前端+java管理后台+cpp深度学习算法后台)

目录智慧教室在线监考系统 github仓库点击这里架构功能考生人脸信息上传考生点名作弊检测服务器管理安装和启动说明数据服务需要docker mysql redis minio 流媒体服务器前端管理系统 smart c
The 2019 ICPC Asia Yinchuan Regional Programming Contest/2019银川区域赛 D Easy Problem(莫比乌斯反演+欧拉降幂)

题意给你 n m d k n m d k n m d k计算下列式子
WebBrower控件接口表

The OLECMDID enumeration specifies which command to execute The commands in this enumeration are the standard commands d

随机推荐

解决maven项目jdbc报错：java.lang.ClassNotFoundException: com.mysql.jdbc.Driver

博主使用flink连接数据库时报错完整报错是 switched from INITIALIZING to FAILED with failure cause java lang ClassNotFoundException com mys
环形链表II

原题链接本题要求找到环的入口且 O n O n O n 的时间复杂度 O 1
猴博士数电模电，百度网盘亲测有效。

模电 https pan baidu com s 1pLzPtvnNsslxs 3RMOpsGQ n n 提取码 xx8j n n n n 数电 https pan baidu com s 1IZnpeLNiX5 Y4ePtMfyXdA n
vite和webpack的区别及优势

webpack会先打包然后启动开发服务器请求服务器时直接给予打包结果 vite直接启动开发服务器请求哪个模块再对该模块进行实时编译打包原理 vite优点 webpack服务器启动速度比vite慢由于vite启动的时候不需要打包也
双向链表删除节点时间复杂度_Leetcode简洁笔记第19题：删除链表的倒数第N个节点...

给定一个链表删除链表的倒数第 N 个节点并且返回链表的头结点本文答案参考自leetcode官方题解方法1 先遍历再删除时间复杂度 O L 空间复杂度 O 1 删除链表的倒数第 N 个节点即删除链表的第 L n 1 个节点因
SQL注入-堆叠注入

SQL注入堆叠注入原理数据库支持堆叠查询所谓堆叠查询就是执行多条语句语句以隔开并且代码使用了支持堆叠查询的函数列如PHP的mysqli multi query 堆叠注入就是在第二条语句中构造payload 注页面只返回第一
Linux下docker的常用命令

我们来了解一下常用的docker命令其中docker container命令中的参数有同于docker命令的参数的其用法相同效果一样 docker container命令的参数和docker命令的参数不同的有prune ls 其中d
若依框架项目部署后路由报错

若依框架部署到服务器后动态路由报错无法访问原因是有些版本不支持动态import导入解决找到 store modules permission js 将 import引入改为require export const loadView
BigDecimal的使用

1 初始化推荐使用字符串初始化直接使用数字会导致精度问题直接使用数字 BigDecimal num new BigDecimal 0 05 使用字符串 BigDecimal num1 new BigDecimal 0 05 BigDe
入侵杂草算法matlab,一种基于入侵杂草算法改进的差分进化算法

1 引言进化算法是模仿生物进化过程设计的现代优化方法作为一种有效的随机优化方法被广泛应用于求解复杂优化问题 DE算法 1 使用浮点矢量进行个体编码通过简单的变异交叉及竞争算子实现在连续空间中的随机搜索 DE算法原理简单易于理解和
网页常用JS/VBS代码

nc ntextmenu window event returnValue false 将彻底屏蔽鼠标右键 table border border td no td table 可用于Table 2 取消选取防止复制 3 npaste r
WEB靶场搭建教程（PHPstudy+SQLllib+DVWA+upload-labs）

WEB靶场搭建教程 PHPstudy SQLllib DVWA upload labs 0x00 简介 0x01 PHPstudy 0x02 搭建SQLi labs靶场 0x03 搭建DVWA靶场 0x04 搭建upload labs靶场
深入浅出Redis-redis底层数据结构

相信使用过Redis 的各位同学都很清楚 Redis 是一个基于键值对 key value 的分布式存储系统与Memcached类似却优于Memcached的一个高性能的key value数据库在 Redis设计与实现这样描述 Re
ideagit回退回滚到以前的指定版本

idea git gitee gitlab 回退回滚到以前的指定版本分为三步 1 本地库硬 hard 回滚 2 远程库混合 mixed 回滚 3 最好等待一分钟让代码回滚后可以被git识别代码状态提交到远程库首先是准备工作我下面先提交
Spring中对于@RequestBody的参数解析问题

文章目录问题起源问题延伸代码实现前置准备阶段选择解决方案如何自定义Resolver 处理类型如何自定义HttpMessageConverter 思考总结问题起源今天后端与前端同事在讨论对于只有一个参数的接口能否不将参数当
Linux文件系统简单认识学习笔记

Linux文件系统简单认识 ReadMe 1 什么是文件系统 2 文件系统文件管理系统的方法的种类有哪些 3 什么是分区 4 什么是文件系统目录结构 5 什么虚拟文件系统Virtual File System 6 虚拟文件系统有什么作用
C语言头文件和源文件差异，#include两种引用方式差异

一些初学c语言的人不知道头文件 h文件原来还可以自己写的只知道调用系统库函数时要使用 include语句将某些头文件包含进去其实头文件跟 c文件一样是可以自己写的头文件是一种文本文件使用文本编辑器将代码编写好之后以扩展名
Java将一个List中的值赋值给另一个List

刷leetcode中的一道dfs题时添加结果集时如果不新创建list所有添加的list都是同一个并且回溯得到时候会删掉所有元素 Java中的作用有两个 1 赋值 2 指向地址当对基本数据类型进行赋值时的作用就是单纯的赋值例如 i
使用zabbix监控avamar【一】

1 介绍 avamar是dell的一款数据备份产品用于公司私有云平台虚拟机备份虽然不是与业务直接相关关注度不是特别高也正因为如此偶尔出现备份失败问题不能及时发现所以要加入公司的智慧运维系统以zabbix为底层开发 2 选择模式
变分推断的数学推导

这里只给出变分推断的数学推导变分颇为高深这里只是简单介绍一下基本概念想了解更多详见 https blog csdn net weixin 40255337 article details 83088786 变分推断的目的是构造 q w

变分推断的数学推导

变分推断的数学推导 的相关文章

随机推荐

热门标签

变分推断的数学推导的相关文章