混合分布(mixture distribution)

2023-11-18

1 基本概念

  在概率与统计中,如果我们有一个包含多个随机变量的随机变量集合,再基于该集合生成一个新的随机变量,则该随机变量的分布称为混合分布(mixture distribution)。具体来说,首先,根据给定概率从集合中随机选取一个随机变量,然后再实现(realize)该随机变量的值。集合中的随机变量可以是随机实数,也可以是随机向量(每个向量的维数相同),在这种情况下,混合分布是多变量分布。
  如果集合中的随机变量是连续的,则生成的随机变量也将是连续的,其概率密度函数有时被称为混合密度(mixture density)。累积分布函数(以及概率密度函数,如果存在的话)可以表示为其它分布函数和密度函数的凸组合(即加权和,非负权重总和为1)。单分布(individual distribution)被组合在一起形成混合分布,我们称这些单分布为混合分量(mixture component),与每个分量对应的概率(或权重)称为混合权重。混合分布中分量的个数通常是有限的,尽管在某些情况下分量个数可能无穷大。
  需要区分两种情况。第一种情况,某个随机变量的分布函数或密度是分量集合(例如,混合分布)之和;第二种情况,一个随机变量的值是两个或者更多基本随机变量的和,这时用卷积运算给出分布。举例来说,两个均值不等的联合正态分布随机变量之和,仍然满足正态分布。然而,用两个具有不同均值的正态分布产生的混合密度,只要两个均值距离足够远,则分布会具有两个峰值,表明这个分布与正态分布有根本不同。

  下面我们就来具体看下这个例子。我们考虑随机变量集合中有两个正态分布的随机变量,这两个正态分布的方差相等,但均值不等。现在从该集合中等概率(50%)地选取一个随机变量,得到结果变量。与单个正态分布相比,总体分布将呈现较低的峰度–单个正态分布的均值落在总体分布的肩膀上。如果两个峰值离得足够远,例如标准偏差的两倍以上即 ∣ μ 1 − μ 2 ∣ > 2 σ |\mu_1-\mu_2|>2\sigma μ1μ2>2σ,就形成双峰分布;否则就只是具有宽峰。结果变量的变化也较两个原始随机变量的变化更剧烈(由于从不同均值扩展而来),因此与偏差固定为 σ \sigma σ的正态分布相比,呈现出过度分散性。然而,如果与偏差等于整体分布偏差的正态分布相比,则结果变量的分布不会表现出过度分散性。换句话说,过度分散性是由于两个均值带来的。
  反之,如果两个随机变量的均值相等,则结果变量的分布将呈现大的峰度,即具有比单个正态分布更为陡峭的峰值和更严重的拖尾(也即肩膀更浅)。

2 基本性质

  • 有限可数混合
      给定概率密度函数集合 p 1 ( x ) , … , p n ( x ) p_1(x),\ldots, p_n(x) p1(x),,pn(x),或者相应的累计分布函数 P 1 ( x ) , … , P n ( x ) P_1(x),\ldots, P_n(x) P1(x),,Pn(x),以及权重 w 1 , … , w n w_1,\ldots,w_n w1,,wn,这里 w i ≤ 0 w_i\le 0 wi0 ∑ w i = 1 \sum w_i=1 wi=1,可得密度函数
    p ( x ) = ∑ i = 1 n w i p i ( x ) , p(x)=\sum_{i=1}^n w_ip_i(x), p(x)=i=1nwipi(x),或分布函数
    F ( x ) = ∑ i = 1 n w i P i ( x ) , F(x)=\sum_{i=1}^{n}w_iP_i(x), F(x)=i=1nwiPi(x),这里二者均为凸组合。

  • 凸性
      概率密度函数的组合不一定是概率密度,因为它可能为负或者积分结果不为零。然而,概率密度函数的凸组合保持了这两个特性(非负以及积分等于1),因此混合密度本身就是概率密度函数。


  •   设 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X1,X2,,Xn表示 n n n个分量分布的随机变量, X X X表示混合分布的随机变量。因此,对于函数 H ( ⋅ ) H(\cdot) H(),如果 E [ H ( X i ) ] {\mathbb E}[H(X_i)] E[H(Xi)]存在,并且假定分量分布 p i ( x ) p_i(x) pi(x)存在,则有
    E [ H ( X ) ] = ∫ − ∞ ∞ H ( x ) ∑ i = 1 n w i p i ( x ) d x = ∑ i = 1 n w i ∫ − ∞ ∞ p i ( x ) H ( x ) = ∑ i = 1 n w i E [ H ( X i ) ] . \begin{aligned} {\mathbb E}[H(X)]&=\int_{-\infty}^{\infty}H(x)\sum_{i=1}^{n}w_ip_i(x)dx\\ &=\sum_{i=1}^{n}w_i\int_{-\infty}^{\infty}p_i(x)H(x)\\ &=\sum_{i=1}^{n}w_i{\mathbb E}[H(X_i)]. \end{aligned} E[H(X)]=H(x)i=1nwipi(x)dx=i=1nwipi(x)H(x)=i=1nwiE[H(Xi)].不难发现, j j j阶原点矩是分量 j j j阶矩的加权平均。进一步,关于 H ( x ) = ( x − μ ) j H(x)=(x-\mu)^j H(x)=(xμ)j的均值(即 j j j阶中心距)为二项式展开
    E [ ( X − μ ) j ] = ∑ i = 1 n w i E [ ( X i − μ i + μ i − μ ) j ] = ∑ i = 1 n w i ∑ k = 0 j ( j k ) ( μ i − μ ) j − k E [ ( X i − μ i ) k ] \begin{aligned} {\mathbb E}[(X-\mu)^j]&=\sum_{i=1}^{n}w_i{\mathbb E}[(X_i-\mu_i+\mu_i-\mu)^j]\\ &=\sum_{i=1}^{n}w_i\sum_{k=0}^{j}\binom{j}{k}(\mu_i-\mu)^{j-k}{\mathbb E}[(X_i-\mu_i)^k] \end{aligned} E[(Xμ)j]=i=1nwiE[(Xiμi+μiμ)j]=i=1nwik=0j(kj)(μiμ)jkE[(Xiμi)k]其中 μ i \mu_i μi表示第 i i i个分量的均值。
      考虑权重为 w i w_i wi,均值为 μ i \mu_i μi,方差为 σ i \sigma_i σi的一维分布的混合分布,其均值和方差为
    E [ X ] = μ = ∑ i = 1 n w i μ i , E [ ( X − μ ) 2 ] = σ 2 = ∑ i = 1 n w i [ ( μ i − μ ) 2 + σ i 2 ] = ∑ i = 1 n w i ( μ i 2 + σ i 2 ) − μ 2 . \begin{aligned} &{\mathbb E}[X]=\mu=\sum_{i=1}^{n}w_i\mu_i,\\ &E[(X-\mu)^2]=\sigma^2=\sum_{i=1}^{n}w_i[(\mu_i-\mu)^2+\sigma^2_i]=\sum_{i=1}^{n}w_i(\mu_i^2+\sigma_i^2)-\mu^2. \end{aligned} E[X]=μ=i=1nwiμi,E[(Xμ)2]=σ2=i=1nwi[(μiμ)2+σi2]=i=1nwi(μi2+σi2)μ2.这些关系突出了混合分布有可能具有非平凡高阶矩(如偏斜和峰度(肥尾)以及多模态)的潜力,即使分量本身没有此类特征。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

混合分布(mixture distribution) 的相关文章

随机推荐

  • LVGL---文本框(lv_textarea)

    目录 lv textarea文档地址 lv textarea文档地址 lvgl中文版本 v8 2 对应网盘中文文档 LVGL官方英文原版 v8 2
  • JQuery中&(‘#form‘).serialize()方法失效

    JQuery中serialize方法失效 要按照以下步骤检查 1 id是不是重名 2 hidden和display none设置以后 元素并不会被序列化 后台也无法获取 检查是不是有这个属性 3 form标签中的input标签中id和nam
  • 极简短网址链接生成系统网站源码

    极简短网址链接生成系统 前两年流行的新浪短网址和一些小站长搭建的短网址基本都gg了 想要一个既稳定又好用的短网址系统只有自己搭建了 今天给大家分享一个很好用的短网址系统 本系统是国内程序员开发 后台简洁 适合自用 安装教程 1 上传源码并解
  • .net下用c# 编写成语字典查询工具

    呵呵 以前弄的一个成语字典数据库 最近用C 写了个查询工具 界面 源代码如下 http blog csdn net greenerycn 请遵守署名非商业的CC版权 using System using System Collections
  • 【往届均已检索】2023年控制理论与应用国际会议(ICoCTA 2023)

    往届均已检索 2023年控制理论与应用国际会议 ICoCTA 2023 重要信息 会议网址 www icocta org 会议时间 2023年10月20 22日 召开地点 福建 厦门 截稿时间 2023年8月30日 录用通知 投稿后2周内
  • 时间格式2019-06-27T16:00:00.000Z转换为北京时间

    时间的描述 UTC 国际时间 UTC 8 伦敦时间 UTC 8就是国际时加八小时 是东八区时间 也就是北京时间 String dateTime 2019 06 27T16 00 00 000Z dateTime dateTime repla
  • 让ChatGPT帮你写一个剧情脚本

    最近 很多视频制作者正在使用AI编写视频脚本 效率直接提升20倍以上 而ChatGPT作为一个强大的AI模型 在各个领域都得到了广泛应用 尽管对于ChatGPT的介绍不是很多 但是它已经在很多自媒体平台上被广泛利用来处理工作了 如果你想学习
  • 激活函数及其各自的优缺点

    原文链接 感谢原作者 温故知新 激活函数及其各自的优缺点 1 什么是激活函数 所谓激活函数 Activation Function 就是在人工神经网络的神经元上运行的函数 负责将神经元的输入映射到输出端 激活函数对于人工神经网络模型去学习
  • 整体学习法之信息分类

    在学习的时候 我们都是有一个流程 获取信息 gt 理解信息 gt 扩展信息 gt 纠正信息 gt 应用信息 信息分成以下几类 随意信息 比如太阳半径多少 苹果的价格这些 都是一些毫无规律的东西 这些就是靠机械记忆 几乎不需要什么处理 也没有
  • [YOLO专题-16]:YOLO V5 - 如何把labelme json训练数据集批量转换成yolo数据集

    作者主页 文火冰糖的硅基工坊 文火冰糖 王文兵 的博客 文火冰糖的硅基工坊 CSDN博客 本文网址 https blog csdn net HiWangWenBing article details 122334367 目录 前言 第1章
  • Java高级开发工程师面试题汇总

    面试主要涉及到的技术点 概述 以Java编程基础 JVM原理 Spring Spring Boot Redis Zookeeper 消息队列 Kafka Rocket MQ MySQL等为主 也包括Dubbo Tomcat性能优化 容器化技
  • 被腾讯云的AI绘画整破防了

    购买 618活动 贪便宜29 9买了个腾讯云的AI绘画 问题 主要遇到了两个问题 整破防了兄弟们 1 文档问题 只封装了请求之后获取base64格式的图片 没有封装如何从base64转换成图片展示出来 这个还需要自己去开发 2 sdk 安装
  • mysql 续行符_继续字符集——「一个命令行搞懂Mysql字符集」

    其实我纠结挺久 要不要写这一篇文章 不怎么想让大家感觉我好像只会字符集一样 Mysql在数据的存储上 提供了不同的字符集支持 在数据的比对上 又提供了不同的字符序支持 与Oracle实例级别的设置不同 Mysql很灵活 它提供了不同级别的设
  • 蓝桥杯算法训练VIP-求先序排列

    题目 题目链接 题解 递归 首先要了解什么是先序遍历 中序遍历和后序遍历 大佬讲解树的遍历 一般同学们应该都知道如何遍历 这个题有点像模拟实现题 就是把你手算的过程实现一遍 整体思路 先从后序遍历中确定根 再去中序遍历中找到根的左右两侧的子
  • 超线程技术

    超线程 HT Hyper Threading 是英特尔研发的一种技术 于2002年发布 超线程技术原先只应用于Xeon 处理器中 当时称为 Super Threading 之后陆续应用在Pentium 4 HT中 早期代号为Jackson
  • 字体图标的使用方式

    字体图标的使用 无论用哪种方法 咋们首先都得引入文件 如何使用字体图标呢 首先咋们要先了解到一个东西 这个东西就是字体图标库 https www iconfont cn 字体图标有四种引入方式 无论何种引入方式 都要先下载本地字体包 引入c
  • Anaconda Navigator打不开 This application failed to start because it could not find or load the QT ....

    anaconda Navigator打不开 直接弹出错误窗口 在网上试了很多方法都没有成功 折腾了好久 卸载重装还是一样的错误 手动添加过如下的环境变量 网上有的人成功了但是我没有 还是报错 下面分享以下我最后解决的方法给大家参考 1 删除
  • 多元有序logistic回归_stata速学

    NO 07 ZEYI 06 2020 正文共 2010字 28图 预计阅读时间 6分钟 嘿喽 我是则已 这是stata的第七期学习 前面学习了最小二乘回归分析 非线性回归分析都要求因变量是连续变量 但很多时候因变量是离散的 即1就是1 2就
  • CUDA使用结构体传输时出现写入位置的访问冲突

    这是我的之前写的关于在CUDA中传输结构体的代码 CUDA结构体传输 include cuda runtime h include device launch parameters h include
  • 混合分布(mixture distribution)

    文章目录 1 基本概念 2 基本性质 1 基本概念 在概率与统计中 如果我们有一个包含多个随机变量的随机变量集合 再基于该集合生成一个新的随机变量 则该随机变量的分布称为混合分布 mixture distribution 具体来说 首先 根