作者:禅与计算机程序设计艺术
概率图模型(Probabilistic Graphical Model)(PGM)是现代统计学习中的一个重要工具,它通过描述变量间的依赖关系和概率分布来对复杂系统进行建模。概率图模型由两部分组成:一是概率模型,它定义了变量之间的联合概率分布;二是结构模型,它定义了变量之间可能的因果影响。在深度学习领域中,PGM被广泛应用于表示数据生成过程中的概率性依赖关系,可以方便地表示各种复杂的结构。
本文将通过简要介绍概率图模型及其背后的数学知识,并结合一些实际案例,为读者提供概率图模型的相关背景知识和方法论。希望能够帮助读者更加深入地理解和运用概率图模型。
2.基本概念术语说明
(1)随机变量
一个变量称作是随机变量(Random Variable),其值取自某个概率分布。例如,某人的身高、体重、IQ、婚姻状况都是随机变量。概率分布是指变量所服从的随机性。通常来说,随机变量可以分为离散型随机变量和连续型随机变量。
离散型随机变量
如果随机变量X的取值可以被枚举出有限个元素,则称其为离散型随机变量。离散型随机变量的概率分布通常用概率质量函数(Probability Mass Function,PMF)表示,即给定随机变量X=x时,其概率P(X=x)。比如,抛掷硬币的结果X,X可能取值为正面或反面,则X的PMF为: $$ \begin{align} p(X=x_i)= \begin{cases} p,& x_i=H\ 1-p,& x_i=T \end{cases}\quad (i=1,2),