先验概率及后验概率等解释

2023-11-19

20201010 -

0. 引言

在学习统计学的时候,在概率估计的部分,经常会遇到最大似然估计,最大后验估计等名词,这些似然和后验,都跟贝叶斯准则中的一些名词定义有关。这里参考书籍《Think Bayes》这部书,来记录这些名词。

1. 由糖果例子来解释名词

用最简单的一句话来说,贝叶斯准则就是一个公式,这个公式在考试的时候只要你会用,把问题形式化之后,甚至于有些题目直接给你了要求解的最终目标,都不用你对问题进行分析,直接套用公式就行了。但在实际问题的处理中,还是需要对问题的深入理解。考试考了高分,不代表解决问题的能力就是满分。下面通过一个例子开始,然后引入贝叶斯公式,最后解释下各个名词概念。

1.1 糖果例子

假设这里有两个糖果袋子,每个糖果袋子中有若干个糖果,其中袋子1中30个红糖果和10个绿糖果,而袋子2中两种糖果各有20个。那么随机从选取一个袋子,并从中随机取一个糖果,若这个糖果是红色的,那么这个糖果来自袋子1的概率有多大。

问题很简单,这也是很多概率书在讲解条件概率或者贝叶斯准则时最喜欢用的例子。那么我这里把这个问题利用概率的语言来定义一下。

设从任意一个袋子中取出红色糖果为事件 R R R,而取出绿色糖果为事件 G G G;随机选择袋子的过程中,若选中的袋子是袋子1,事件为 B 1 B_1 B1,为袋子2时为事件 B 2 B_2 B2。利用 P ( X ) P(X) P(X)表示事件 X X X发生的概率,而 P ( X ∣ Y ) P(X|Y) P(XY)是在事件 Y Y Y发生的情况下,事件 X X X发生的概率,即条件概率。

根据上述的定义,我们要求解的概率是 P ( B 1 ∣ R ) P(B_1|R) P(B1R),但是如果反过来,我要求 P ( R ∣ B 1 ) P(R|B_1) P(RB1)的概率,这个问题很简单,也很直观,直接就是 3 4 \frac{3}{4} 43就完事了。但是实际情况是两者并不相等。
既然是这样的话,那么我们在上述问题中得到了那些显而易见的结论呢?仅仅针对 P ( B 1 ∣ R ) P(B_1|R) P(B1R)中出现的事件。
P ( B 1 ) = 1 2 = 0.5 P ( R ) = 30 + 20 30 + 20 + 10 + 20 = 5 8 = 0.625 P ( R ∣ B 1 ) = 30 30 + 10 = 0.75 P(B_1)=\frac{1}{2}=0.5 \\ \quad \\ P(R)=\frac{30+20}{30+20+10+20}=\frac{5}{8}=0.625\\ \quad \\ P(R|B_1)=\frac{30}{30+10}=0.75 P(B1)=21=0.5P(R)=30+20+10+2030+20=85=0.625P(RB1)=30+1030=0.75
好了,这些就是与要求解的问题相关的所有事件概率,下面由贝叶斯准则来进行计算。

1.2 贝叶斯准则

P ( A B ) P(AB) P(AB)在事件 A 、 B A、B AB独立的时候,存在 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),两个事件独立的时候,第一个事件发生并不会影响第二个事件发生的概率,从概率公式上来讲,就是 P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(BA)=P(B),但不独立的时候该式不成立。但是对于任意的事件 A 、 B A、B AB,联合概率 P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B|A) P(AB)=P(A)P(BA)。因为联合概率满足交换律, P ( A B ) = P ( B A ) P(AB)=P(BA) P(AB)=P(BA)。那么可以推导以下公式。
P ( A B ) = P ( A ) P ( B ∣ A ) P ( B A ) = P ( B ) P ( A ∣ B ) P ( A ) P ( B ∣ A ) = P ( B ) P ( A ∣ B ) P(AB)=P(A)P(B|A) \\ P(BA)=P(B)P(A|B) \\ P(A)P(B|A)=P(B)P(A|B) P(AB)=P(A)P(BA)P(BA)=P(B)P(AB)P(A)P(BA)=P(B)P(AB)
那么根据上述公式,可以更进一步,求解某个条件概率,例如求解 P ( A ∣ B ) P(A|B) P(AB)
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B)=\frac{P(A)P(B|A)}{P(B)} P(AB)=P(B)P(A)P(BA)
到这里为止,本篇文章要解释的名词就出线了,先验概率,后验概率等,那么前面我们求解的概率 P ( B 1 ∣ R ) P(B_1|R) P(B1R),利用该公式就可以计算出来。
P ( B 1 ∣ R ) = P ( B 1 ) P ( R ∣ B 1 ) P ( R ) P(B_1|R)=\frac{P(B_1)P(R|B_1)}{P(R)} P(B1R)=P(R)P(B1)P(RB1)
这些值正好都是前面列出来的,计算的最后结果是0.6。

1.3 名词解释

关于这部分内容,《Think Bayes》进入了另一个小节,The diachronic interpretation,谷歌翻译为历时解释,也就是随着时间的推移,越来越多事件发生,从而导致概率发生了变化。也就是说,某个假设 H H H出现了某些数据 D D D之后,概率发生了更新。
那么按照上述内容改写贝叶斯准则。
P ( H ∣ D ) = P ( H ) P ( D ∣ H ) P ( D ) P(H|D)=\frac{P(H)P(D|H)}{P(D)} P(HD)=P(D)P(H)P(DH)
在历时解释的方式中,有以下定义:

  • P ( H ) P(H) P(H)被称为先验概率,也就是数据 D D D被看到之前,假设 H H H发生的概率
  • P ( H ∣ D P(H|D P(HD被称为后验概率,是假设 H H H在看到数据 D D D之后被更新的概率。
  • P ( D ∣ H ) P(D|H) P(DH)被称为似然值,是指数据 D D D在假设 H H H下出现的概率。
  • P ( D ) P(D) P(D)是数据 D D D出现的概率,基于任何的假设,一般是一个归一化的常数。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

先验概率及后验概率等解释 的相关文章

  • MATLAB2012a下载、安装及破解方法

    下载地址如下 http yunpan cn cyjGMugpDGsse 提取码 32e8 安装步骤如下 1 解压压缩包 打开文件夹内的setup exe 2 选择 不使用Internet安装 3 接受许可协议条款 点击 是 4 选择 我已有

随机推荐

  • Python,燃气火焰检测主要步骤!

    问题描述 在现有的基础上 燃气火焰的检测主要是基于火焰颜色特征 由于燃气火焰不同于普通火焰 其中蓝色分量较多 一般的检测方法准确度不够 故采取其他方法来检测火焰 下面主要介绍4个步骤的思路和主要的 python 代码 解决方案 1 背景差分
  • Python和Matplotlib电磁一维二维三维模拟

    自由空间中传播的脉冲一维模拟 自由空间的时间相关麦克斯韦旋度方程为 E
  • vue3中的readonly

    接受一个对象 不论是响应式还是普通的 或是一个 ref 返回一个原值的只读代理 只读代理是深层的 对任何嵌套属性的访问都将是只读的 它的 ref 解包行为与 reactive 相同 但解包得到的值是只读的 类型 function reado
  • VS2019版本下载详细介绍~

    一 下载地址 第一种方法 VS官网 Visual Studio 2022 IDE 适用于软件开发人员的编程工具 因为官网现在主推2022版本的VS 所以需要选择老旧版本下载 点击下载按钮 向下滑动 该方法需要登录微软账户 才能选择老旧版本的
  • sort的用法

    sort的用法 详细见cplusplus 1 默认的sort函数是按升序排 对应于1 sort a a n 两个参数分别为待排序数组的首地址和尾地址 2 可以自己写一个cmp函数 按特定意图进行排序 对应于2 例如 sort algorit
  • SOIL在VS2015搭建

    这是SOIL库的主页 http www lonesock net soil html 下载好解压 进project vc9 用Vs打开项目 编译记得用release 如果用的OPengl是64位的就用64位编译 不然生成的lib不能用 运行
  • 积分图像(Integral Image)和积分直方图

    积分图像文章推荐 http blog sina com cn s blog 4cb0b54301017wwo html https blog csdn net u010807846 article details 50354000 参考文献
  • vue-router的routes中name属性作用详解

    我们常用vue js和vue router来创建单页应用 vue router能很方便的管理所有的单页组件 我们在定义每个路由的时候会有一个name的属性 如下面代码 通常我们不定义这个属性发现也没有任何问题 那么这个name到底有什么用呢
  • R语言绘图:实现数据点的线性拟合,进行显著性分析(R-squared、p-value)、添加公式到图像

    最近在做关于数据点线性拟合相关的研究 感觉R语言在这方面很方便 而且生成的图片很漂亮 所以在这里和大家分享一下代码 这是别人所绘制的拟合图像 很漂亮 自己也用iris鸢尾花数据集进行一个线性拟合看看 拟合线性模型最基本的函数就是lm 格式为
  • 进阶java大师之路,泛型在hashmap上的灵活运用

    由于 公司的试用的框架上 存在大量的hashmap的创建 产生大量的I O 以及内存的消耗 所以 抽了点时间 看书 effective java 这本书 同时 也从项目的作者 framework 上学习 吸取 最终写出了 符合生产的方案 存
  • 【FreeRTOS】Arduino开发STM32

    0 开发环境 工具 Vscode platformio arduino STM32F103C8T6 USB TTL 引脚连接 STM32直接设置为烧录模式即可 烧录完成后会自动运行程序 1 点灯加串口输出调试 注意事项 每次上传程序前 需要
  • krpano 获取当前场景名称

    var scene krpano get xml scene copy scene name scene get xml scene name set scene name get scene get xml scene name copy
  • element-ui中$confirm弹出框的确定和取消按钮互换位置

    element ui中 confirm弹出框的确定和取消按钮互换位置 1 定位元素 2 找到元素class 通过flex布局 进行位置更换 3 app vue中 进行全局修改 确认窗 取消确认按钮位置更换 el message box wr
  • 如何创建一个私有的Docker仓库

    目录 一 在docker的官方网站中直接创建 二 搭建自己本地的仓库 2 1 搭建自己的本地仓库 2 2 为本地镜像添加认证 2 2 1 添加证书加密功能 2 2 2 添加用户登录认证 三 部署Harbor仓库 总所周知 Docker的强大
  • 【项目实战】代码分支管理工具

    一 分支命名规范 develop Bleeding edge development used for development feature Temporary branch off develop used for feature de
  • 如果能下载或不能上传试试chmod 755放开读写权限

    如果能下载或不能上传试试chmod 755放开读写权限
  • MQTT客户端应用编程及接口分析

    MQTT客户端应用编程及接口分析 MQTT协议简介 MQTT是一个基于客户端 服务器的消息发布 订阅传输协议 MQTT协议是轻量 简单 开放和易于实现的 这些特点使它适用范围非常广泛 客户端服务端安装 1 安装 sudo apt add r
  • 如何在mysql中创建学生信息表_数据库怎么创建学生信息表

    大家好 我是时间财富网智能客服时间君 上述问题将由我为大家进行解答 数据库创建学生信息表的方法是 1 新建表 单击数据库 studentDb 前图标 然后右键 表 文件包 单击 新建表 选项 进入 新建表 窗口 2 设定表标识字段id 填写
  • springboot3.x的坑!!!

    正常构建springboot项目出错 背景 2022年底springboot出了3 0 现在默认创建的springboot版本就是3 0 如果其他配置按照以前2 x的来 此时就会产生很多莫名其妙的错误 所以要手动选择2 x
  • 先验概率及后验概率等解释

    20201010 0 引言 在学习统计学的时候 在概率估计的部分 经常会遇到最大似然估计 最大后验估计等名词 这些似然和后验 都跟贝叶斯准则中的一些名词定义有关 这里参考书籍 Think Bayes 这部书 来记录这些名词 1 由糖果例子来