变分推断

2023-11-16

      变分推断是近年来深度学习中一个非常重要的技术手段。推断困难通常是指难以计算p(h|v)或其期望,其中v指的是模型的可观测变量,而h表示隐藏变量。在深度神经网络中,多层的隐藏变量之间联系复杂,无法通过一个具体地概率密度函数来刻画隐藏变量的实际分布情况。即使对于单层的稀疏编码器,倘若隐变量之间没有相关的独立性假设,其内部隐藏单元的概率分布密度函数也是很难刻画的,原因是当输出变量被观测时,其对应的隐藏变量之间遍搭建起了联系(这是结构化概率模型中的一个重要性质:假设A变量可推导出C变量,B变量可推倒C变量,当C变量不可观测即不知道是否发生时,变量A与B可视为时相互独立的,而变量C一旦被观测则使得变量A、B之间搭建起了依赖关系。

      变分推断的前提基础是近似推断,由于直接计算p(h|v)难度非常大,我们可以将传统的极大对数似然logp(v;θ)转化为求其下界的问题,通过引入另一个简单的概率密度分布函数q(h|v)来极大化logp(v;θ)的下界。衡量logp(v;θ)与其下界的标准是KL散度(关于KL散度的理解可参考[1]):


更为具体地,L可进一步化简得:


      变分推断的核心思想就是在关于q的有约束的分布簇上最大化L。一个非常常用的变分学习的方法是加入一些限制使得q是一个因子分布(也就mean-field均值场方法):


进而对L进行进一步化简得到(详细推导可见[2]):


于是最大化L的上界,即最小化散度:

因此可得到q的迭代更新公式:

这就是均值场下的变分推断方法。


[1] https://blog.csdn.net/qq_40406773/article/details/80630280

[2] https://www.aliyun.com/jiaocheng/441651.html


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

变分推断 的相关文章

随机推荐

  • Vue开发 常用方法总结

    nextTick this nextTick 将回调延迟到下次 DOM 更新循环之后执行 在修改数据之后立即使用它 然后等待 DOM 更新 使用场景 在一些情况下 变量进行了初始赋值或更新 但是DOM还未更新完成时 使用变量的值是不起作用的
  • tensorflow实践(一) 安装和调试

    人工智能 机器学习 监督学习 无监督学习 深度学习等等一大堆词语对于每个软件开发人员来说 是最近几年听的最多 也最让人觉的自己离IT未来有差距的词汇 虽然将来人工智能是否如现在预测的广泛的取代大部分行业 但是仅仅就各种才露尖尖角的各种场景如
  • [项目管理-30]:项目成员成熟度以及采取的不同的策略

    目录 前言 一 管理的误区 二 帮助部属的四种层次 2 1 四种类型 层次 2 2 四象限法差别化帮助 三 项目经理自身可以使用的权力 资源 3 1 专家权力 3 2 奖励权力 3 3 正式权力 3 4 参照性权力 3 5 惩罚性 强制性权
  • wps(word)复制过来的文字一行字数不足却自动换行解决办法

    问题描述 在wps或者word里粘贴网页上复制过来的文字常常会出现每行字数不足换行要求却提前换行的情况 如下图所示 问题分析 出现这种情况主要是从网页上复制过来的文字保留了原网站的段落标记 手动换行符 打开显示段落标记 出现向下的箭头符号就
  • 闲谈IPv6-源IP地址的选择(RFC3484读后感)

    杭州数月的连续淅淅沥沥的雨 让我感到舒适 但却不知湿了多少人的皮鞋 回想起2014年的一个周末从上海来杭州 我在思考一个关于IPv6的问题 但一切却不是因为IPv6而起 缘起 在多年以前 我被一个看似很简单的问题困扰了很久很久 问题是这样的
  • 【Zotero高效知识管理】(2)Zotero的安装、百度云存储配置及常用插件安装

    Zotero高效知识管理 专栏其他文章 Zotero文献管理软件的系统性教程 包括安装 全面的配置 基于众多插件的文献导入 管理 引用 笔记方法 Zotero高效知识管理 1 Zotero介绍 Zotero高效知识管理 3 Zotero的文
  • 王爽《汇编语言》第3版 实验4 详解 以及个人的一些小疑问

    实验四 1和2编程 向内存0 2000 23F依次传送数据063 3FH 为什么0 200和0020 0表示的是同一段内存地址 0000 X 16 0200 00200 assume cs codes codes segment mov a
  • android组件之DrawerLayout(抽屉导航)-- 侧滑菜单效果

    一 介绍 导航抽 屉显示 在屏幕的最左侧 默认情况下是隐藏的 当用户用手指从边缘向另一个滑动的时候 会出现一个隐藏的面板 当点击面板外部或者向原来的方向滑动的时候 抽屉导航就会消失了 好了 这个抽屉就是DrawerLayout 该类位于V4
  • MyBatis总结(六)--typeAliases属性介绍

    说明 typeAliases别名处理器 是为 Java 类型设置一个短的名字 可以方便我们 引用某个类 正常情况下不推荐使用该别名处理器 因为使用了别明处理器不方便直接观察到所对应的类 在项目维护起来不方便 1对单个类起别名 在mybati
  • windows10专业版使用远程桌面

    windows企业版远程桌面控制方法 服务器端 打开服务器开关 添加新用户 添加其他用户即可 3 点立即查找 添加要控制的用户 客户端 搜windows远程桌面 添加远程的ip地址即可 家庭想被控制的方法 windows10 远程桌面设置
  • Spring Cloud Sentinel(限流、熔断、降级)、SpringBoot整合Sentinel、Sentinel的使用-60

    文章目录 一 Sentinel简介 1 1 官方文档 1 2 项目地址 1 3 特征 1 4 Sentinel 分为两个部分 1 5 基本概念 1 6 主要作用 流量控制 熔断降级 系统负载保护 1 7 Hystrix 与 Sentinel
  • 机器学习——KNN实现

    一 KNN K近邻 概述 KNN一种基于距离的计算的分类和回归的方法 其主要过程为 计算训练样本和测试样本中每个样本点的距离 常见的距离度量有欧式距离 马氏距离等 对上面所有的距离值进行排序 升序 选前k个最小距离的样本 根据这k个样本的标
  • web信息收集----网站指纹识别

    文章目录 一 网站指纹 web指纹 二 CMS简介 三 指纹识别方法 3 1 在线网站识别 3 2 工具识别 3 3 手动识别 3 4 Wappalyzer插件识别 一 网站指纹 web指纹 Web指纹定义 Web指纹是一种对目标网站的识别
  • Stata改变变量label

    我们用dta格式数据时 label栏可能是无法识别的字符 其中一个原因是我们电脑安装的是简体中文版 但数据原来的label是繁体字 只要用 label var命令就可以更改了 具体用法 label var 变量名称 变量新label 如下所
  • 好像还挺好玩的GAN8——SRGAN实现图像的分辨率提升

    好像还挺好玩的GAN8 SRGAN实现图像的分辨率提升 注意事项 学习前言 什么是SRGAN 代码与训练数据的下载 神经网络组成 1 生成网络 2 判别网络 训练思路 1 对判别模型进行训练 2 对生成模型进行训练 全部代码 1 data
  • JS+CSS实现一个文字跟随屏幕滑动渐入渐出效果

    效果展示 可以看到文字随着屏幕滑动条的滚动逐渐渐入渐出 接下来看看我是怎么实现的把 实现原理 要实现这个效果也很简单 就是利用background image属性的linear gradient给文字加上渐变背景 然后设置backgroun
  • npm、yarn、pnpm如何清除缓存?

    前端工程化创建项目会经常使用各种安装包管理工具 安装各种前端依赖包 例如 npm yarn pnpm等 时间一长 各种安装包管理工具的在安装依赖时 留下的缓存文件就会变得很大 以至于影响系统的运行 因此必要时清除缓存就是一个不错的选择 本文
  • 磁盘调度算法(FCFS、SSTF)例题

    一 原理 先来先服务 FCFS first come first service 根据进程请求访问磁盘的先后次序进行调度 最短寻道时间优先 SSTF Shortest Seek Time First 选择访问的磁道与当前磁头所在的磁道距离最
  • 下列不是HTML网页开发工具的是,网页开发工具有哪些

    越来越多的移动端和桌面端应用开始使用HTML CSS和JS来开发了 而网页设计更是离不开这些语言所需要的工具 下面由小编为大家整理的网页开发工具 希望大家喜欢 网页开发工具 1 Prepo Prepo 是一款同时登录Mac和iOS平台的应用
  • 变分推断

    变分推断是近年来深度学习中一个非常重要的技术手段 推断困难通常是指难以计算p h v 或其期望 其中v指的是模型的可观测变量 而h表示隐藏变量 在深度神经网络中 多层的隐藏变量之间联系复杂 无法通过一个具体地概率密度函数来刻画隐藏变量的实际