详谈概率图模型(PGM)

2023-11-12

引言

\quad \quad 机器学习是根据一些已观察到的证据(如训练样本)来对感兴趣的未知变量(如类别标记)进行估计和预测。概率模型(probabilistic model)提供了一种描述框架,将学习任务归结于计算变量的概率分布。

\quad \quad 在概率模型中,利用已知变量推测未知变量的分布称为推断(inference),其核心是如何基于可观测变量推断出未知变量的条件分布。假定未知变量集合是Y,可观察变量集合是O,其他变量集合是R,生成式(generative)模型考虑联合分布P(Y,R,O);判别式(discriminative)模型考虑条件分布P(Y,R|O);给定一组观测变脸值,推断就是由P(Y,R,O)或P(Y,R|O)得到条件概率分布P(Y|O)。

\quad \quad 直接利用概率求和规则消去变量R不可行,因为即便每个变量只有简单的两种取值,复杂度已去到至少O(2|Y|+|R|);并且属性变量之间还可能存在复杂的联系;因此概率模型的学习,即基于训练样本来估计变量分布的参数是困难的。当概率模型中的变量数量比较多时,其条件依赖关系也比较复杂。我们可以使用图结构的方式将概率模型可视化,以一种直观、简单的方式描述随机变量之间的条件独立性的性质,并可以将一个复杂的联合概率模型分解为一些简单条件概率模型的组合。这就是概率图模型。

1、概述

\quad \quad 概率图模型(PGM, P →概率, G →图形, M →模型),简称图模型(GM),是指一种用图结构来描述多元随机变量之间条件独立关系的概率模型。

  • 概率:
    由于不确定性,我们通常感兴趣解决的问题、感兴趣解决的查询类型或查询类型的本质都是概率性的。原因有很多:

    • 不完全知识
    • 噪声观测
    • 一些导致问题的属性,这些属性在模型中并不存在
  • 图:
    它有助于我们更好地可视化,并且我们使用图论来减少所有参与变量的相关组合的数量,从而使高维概率分布模型更加简洁。

  • 模型:
    模型是一个真实世界的场景或我们要分析的问题的一种声明性(意味着声明和定义不是由领域专家通过使用他们的领域知识和使用统计知识和学习算法与历史数据集派生的)。它是用数学工具如图形或简单的方程式来表示的。

\quad \quad 根据边的性质不同,概率图模型大致可分为两类:

1)使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网(Bayesian network);

2)使用无向图表示变量间的相关关系,称为无向图模型或马尔可夫网(Markov network);

常见图模型结构

在这里插入图片描述

2、基本问题

图模型的基本问题(三个)
(1)表示问题:对于一个概率模型,如何通过图结构来描述变量之间的依赖关系。
(2)学习问题:图模型的学习包括图结构的学习和参数的学习。
(3)推断问题:在已知部分变量时,计算其他变量的条件概率分布。

在这里插入图片描述

2.1 模型表示

\quad \quad 一个图由结点(nodes)(也被称为端点(vertices))和它们之间的链接(links)(也被称为边(edges)或弧( arcs))组成。(更多详细见图论基础)在概率图模型中,每个结点表示一个(或一组随机变量),边则表示这些变量之间的概率关系。

\quad \quad 常见的概率图模型可以分为两类:有向图模型和无向图模型.
(1)有向图模型使用有向非循环图(Directed Acyclic Graph,DAG)来描述变量之间的关系。如果两个节点之间有连边,表示对应的两个变量为因果关系,即不存在其他变量使得这两个节点对应的变量条件独立。
(2)无向图模型使用无向图(Undirected Graph)来描述变量之间的关系。每条边代表两个变量之间有概率依赖关系,但是并不一定是因果关系。

2.1.1 有向图模型

\quad \quad 有向图模型(Directed Graphical Model),也称为贝叶斯网络(BayesianNetwork)或信念网络(Belief Network,BN),是一类用有向图来描述随机向量概率分布的模型。

在这里插入图片描述

在这里插入图片描述

\quad \quad 对于有向图模型,如何求联合概率? P ( x 1 , x 2 , . . . , x n ) = ∏ k = 1 K P ( x k ∣ x π k ) P(x_1,x_2,...,x_n)=\prod_{k=1}^KP(x_k|x_{\pi_k}) P(x1,x2,...,xn)=k=1KP(xkxπk)

在这里插入图片描述

两个性质

条件独立性

\quad \quad 在贝叶斯网络中,如果两个节点是直接连接的,它们肯定是非条件独立的,是直接因果关系。父节点是“因”,子节点是“果”。

\quad \quad 如果两个节点不是直接连接的,但是它们之间有一条经过其他节点的路径连接互连接,它们之间的条件独立性就比较复杂。
在这里插入图片描述


局部马尔可夫性质

\quad \quad 对一个更一般的贝叶斯网络,其局部马尔可夫性质为:每个随机变量在给定父节点的情况下,条件独立于它的非后代节点。
在这里插入图片描述
其中

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

详谈概率图模型(PGM) 的相关文章

  • Pytorch之经典神经网络RNN(三) —— LSTM(simple data)(手写LSTM&反向传播)

    1997年提出的 LSTM是一种特殊的RNN 表现突出 很好地解决了训练RNN过程中的各种问题 在几乎各类问题中都展现出远好于Vanilla RNN的表现 LSTM 和基本的 RNN 是一样的 他的参数也是相同的 长期依赖 Long Ter
  • 开发常见问题汇总

    1 git的问题 在团队开发中使用git作为项目的版本管理和团队协作的工具 避免不了会出现问题 在我们的项目中 由于idea整合了git 所以 配置idea即可使用git 具体配置是在 File gt settings gt Git中 配置

随机推荐

  • 前端vue项目埋点方案

    前端埋点方案 前端埋点主要分为以下三类 代码埋点 在需要埋点的地方添加埋点逻辑代码或自定义属性实现 可视化埋点 使用可视化的工具进行埋点 即无痕埋点 前端页面加载时根据埋点配置 自动调用接口上传埋点数据 无埋点 前端自动采集全部事件并上报埋
  • python框架专栏-Flask框架篇①-基本介绍和安装

    1 Flask简介 Flask诞生于2010年 是Armin ronacher 人名 用 Python 语言基于 Werkzeug 工具箱编写的轻量级Web开发框架 Flask 本身相当于一个内核 其他几乎所有的功能都要用到扩展 邮件扩展F
  • LTE 网络UE端测量

    在LTE网络发生切换时首先需要激活UE端测量过程 UE端用户可采用以下方法实现 1 直接通过eNB的RRC实体实现 也是本文介绍 2 通过已有切换算法配置测量 3 开发新的切换算法并对其配置 首先需要研究测量的内容是什么 NS3通过LteR
  • 求二叉树第k层的结点个数

    tag 二叉树 层次遍历 思路 用层次遍历思路求解 辅助 队列 package com zhaochao tree import java util ArrayList import java util LinkedList import
  • Node.js EventEmitter事件

    Node js EventEmitter Node js 所有的异步 I O 操作在完成时都会发送一个事件到事件队列 Node js 里面的许多对象都会分发事件 一个 net Server 对象会在每次有新连接时触发一个事件 一个 fs r
  • Hibernate-操作数据库-类对象插入-1

    1为非带注解版本 框架 1为非带注解版本 工程框架 Student类 hibernate cfg xml log4j properties Student hbm xml StudentTest类 数据库结构以及表的设计 基于hiberna
  • allegro中pcb文件检查之dangling--line,danging--via

    在日常中 将PCB绘制完成后经常需要对于断线进行检查 在allegro中 可以快速进行检查并修改 步骤 tools quick report dangling lines via and antenna report 即可查看文件中的断线
  • CentOS8.4 配置本地yum源

    目录 挂载光盘 清除原仓库配置文件 配置本地仓库配置文件 查询本地已启用的仓库 尝试安装服务 此处以bind服务为例 易错点 下载链接 挂载光盘 root CentOS8 mkdir p mnt dvd root CentOS8 mount
  • 如何在IDEA中创建Web项目

    棒棒有言 也许我一直照着别人的方向飞 可是这次 我想要用我的方式飞翔一次 人生 既要淡 又要有味 凡事不必太在意 一切随缘 缘深多聚聚 缘浅随它去 凡事看淡点看开些 顺其自然 无意于得 就无所谓失 人生 看轻看淡多少 痛苦就远离你多少 本章
  • 强化学习12——动态规划与策略迭代和值迭代

    上一节我们说了马尔可夫决策过程 它是对完全可观测的环境进行描述的 也就是观测到的内容完整决定了决策所需要的特征 马尔可夫决策过程可以用方程组求解简单问题 但是对于复杂一点的问题 一般通过迭代的思想对其进行求解 动态规划是非常有效的求解马尔可
  • 计算着色器中线程的编号

    ID3D11DeviceContext Dispatch Method Execute a command list from a thread group Syntax void Dispatch in UINT ThreadGroupC
  • Rstudio与R的绑定和更新

    遇到新安装的R与Rstudio没有匹配或者想要更改R的版本 一些老的版本的安装包在新版R上可能不适用 可以如下操作 一 Rstudio与R的绑定 1 选择Tools里的Global Options选项 2 选择General更改R vers
  • webpack配置本地TypeScript编译环境和开启本地服务

    目录 1 创建一个文件夹 2 初始化一个package json文件对我们安装包进行记录 3 安装webpack 4 配置webpack config js文件 1 创建一个文件夹 2 初始化一个package json文件对我们安装包进行
  • pip安装pandas总是失败的解决办法

    先卸载numpy和pandas pip uninstall numpy pip uninstall pandas 再重新安装 按numpy pandas的顺序 1 pip install numpy i https pypi douban
  • CXF开发WebService客户端

    开发必备 1 apache cxf 2 2 6 2 spring ws 1 5 8 3 eclipse jee galileo SR1 win32 开发步骤 一 新建一个普通的java工程 名字叫WebService CXF Client
  • Leetcode刷题48-575. 分糖果(C++详细解法!!!)

    题目来源 链接 https leetcode cn com problems distribute candies 575 分糖果 1 问题描述 2 我的解决方案 3 大神们的解决方案 4 我的收获 4 1 set的用法 4 2 map容器
  • ubuntu 安装Android SDK,如何在Ubuntu12.1下安装Android SDK

    如何在Ubuntu12 1下安装Android SDK 在Ubuntu下 安装 Android SDK 有两种方式 1 为使用ADT Eclipse安装 这也是官方推荐的方式 适合使用Eclipse开发的开发者 2 直接安装Android
  • 跨行业数据挖掘过程标准及其在 Python 中的应用

    跨行业数据挖掘过程标准及其在 Python 中的应用 数据挖掘是一种从大量数据中提取有用信息的过程 它在各个行业中都有广泛的应用 为了规范数据挖掘过程 CRISP DM Cross Industry Standard Process for
  • PPP与PPPoe

    PPP 二层最常用的封装技术 PPP共定义了三个协议组件 分别是数据封装方式 链路控制协议 Link Control Protocol LCP 和网络层控制协议 Network Control Protocol NCP 数据封装方式定义了如
  • 详谈概率图模型(PGM)

    概率图 引言 1 概述 2 基本问题 2 1 模型表示 2 1 1 有向图模型 2 1 2 无向图模型 2 1 3 有向图和无向图之间的转化 2 2 学习问题 2 3 推断 引言 quad quad 机器学习是根据一些已观察到的证据 如训练