人工智能数学基础--概率与统计9:概率运算、加法公理、事件的独立性、概率乘法定理、条件概率、全概率公式以及贝叶斯公式

2023-11-15

一、概述

这大半年都很忙,学习时间太少,导致概率论的学习停滞不前,期间AI大佬herosunly推荐了陈希孺老先生的概率论教材,与最开始学习的美版M.R.斯皮格尔等著作的《概率与统计》表示差异比较大(具体请见《人工智能数学基础–概率与统计7:学习中一些术语的称呼或表示变化说明以及独立事件的一些补充推论》的说明),但学习起来更容易理解一些,最近利用国庆开始学习这本教材,感觉还是有必要继续学。

由于表示的变化,为了知识的承前启后,基于陈老先生的教材对事件独立性、条件概率等前面章节介绍过的内容在本文重新介绍一下。

二、事件的蕴涵、包含及相等

在同一试验下的两个事件A和B,如果当A发生时B必发生,则称A蕴含B,或者说B包含A,记为A ⊂ B。若A、B互相蕴含,即A⊂B且B⊂A,则称A、B 两事件相等,记为A=B。

注意:蕴涵和包含是相反关系。

三、事件的互斥和对立

  1. 如果两个事件A、B不可能在同一试验中都发生(包括都不发生)则称它们是互斥的;
  2. 如果一些事件中任意两个都是互斥的,则称它们是两两互斥的;
  3. 如果A为一事件,则事件B={A不发生} 称为A的对立事件,记为:
    在这里插入图片描述

四、事件的和(或称为并)以及加法公理

  1. 设有2个时间A、B,定义一个新事件C:C={A发生或B发生}={A、B至少发生一个},则称事件C为事件A、B的和(或并),记为C=A+B;
  2. 定理:若干个互斥事件之和的概率,等于各事件的概率之和,这里事件的个数可以是有限的或无限的,这个定理就称为概率的加法定理(也称为加法公理),记为:P(A1+A2+…)=P(A1)+P(A2)+…。注意概率的加法定理的基础条件是各事件必须是两两互斥的;
  3. 事件A的对立事件Ac的概率P(Ac)=1-P(A)。

五、事件的积(或称为交)和差

  1. 如果有两个事件A、B,定义事件C={A、B都发生},则称事件C是事件AB的乘积(或),记为:C=AB

  2. 多个事件A1、A2、…的积A是指事件A1、A2、…都发生,记为:A=A1A2…,也可以记为:
    在这里插入图片描述

  3. 两个事件A、B之差记为 A-B,定义为:A-B={A发生,B不发生},A-B = ABc,因此差是可以通过积进行定义。
    概率加法公理

六、事件的运算法则

假设有事件A、B、C,则有关于事件的如下运算法则:

  1. 加法交换律:A+B=B+A;
  2. 乘法交换律:AB=BA;
  3. 乘法结合律:(AB)C=A(BC);
  4. 分配律:A(B-C)=AB-AC。

七、条件概率

  • 一般来讲,条件概率是附加一定条件之后所计算出的概率;
  • 在概率论中,决定试验的基础条件被看做已定不变的,如果不再加入其它条件或假定,则算出的概率就是无条件概率
  • 设有两个事件A、B,且P(B)≠0,则在给定B发生的条件下A发生的概率为条件概率,记为P(A|B),定义为:P(A|B)=P(AB)/P(B)。

老猿注:为什么条件概率的计算公式是P(A|B)=P(AB)/P(B),请参考《人工智能数学基础–概率与统计1:随机试验、样本空间、事件、概率公理定理以及条件概率和贝叶斯法则》。

八、事件的独立性和概率乘法定理

  1. 对于两个事件A、B,如果B发生与否对A的发生可能性毫无影响,则称为事件A和B是独立的。由于B的发生不影响A的发生,此时P(A|B)=P(A),按照 条件概率的计算公式P(A|B)=P(AB)/P(B)可得:P(AB)=P(A)P(B);
  2. 两个事件A、B是独立的,则P(AB)=P(A)P(B),反过来如果两个事件A、B满足P(AB)=P(A)P(B),则称A、B是独立的;
  3. 两个独立事件A、B的积AB的概率P(AB)等于其各自概率的乘积P(A)P(B),P(AB)=P(A)P(B)称为概率的乘法定律
  4. 设A1、A2、…为有限或无限个事件,如果任意取出有限个Aj1、Aj2、…、Ajn,P(Aj1Aj2…Ajn)=P(Aj1)P(Aj2)…P(Ajn),则称事件A1、A2、…相互独立。根据本公式定义的独立事件与由条件概率触发的定义是等价的,或者说对任意Aj1、Aj2、…、Ajn,有:
    P(Aj1|Aj2…Ajn)=P(Aj1),即任意事件Aj1发生的可能性大小,不受其他事件发生的影响;
  5. 若干个独立事件A1、A2、…An之积的概率,等于各事件概率的积,P(A1A2…An)=P(A1)P(A2)…P(An);
  6. 独立事件的任意一部分也独立,不同独立事件决定的事件也独立,这里说的决定是指通过运算得到,注意如果决定2个事件中有相同事件则决定的事件不是相互独立的;
  7. 若干个独立事件A1、A2、…An,将其中任意一部分改为对立事件时,所得事件仍然相互独立 。

老猿注:独立事件的积的概率等于各自概率的积,互斥事件的和的概率等于各自概率的和,这两者的前提是不同的,即相加是互斥,相乘是独立。

九、全概率公式

  1. 设B1、B2、…为有限个或无限个事件,它们两两互斥且在每次试验中至少发生一个,即:
    BiBj=∅(不可能事件)(i≠j)
    B1+B2+…=Ω(必然事件)
    称具有这样性质的一组事件称为“完备事件群”
  2. 对上述完备事件群,考虑任一事件A,有A=AΩ=AB1+AB2+…,由于B1、B2、…两两互斥,则AB1、AB2、…两两互斥,依据加法定理:P(A)=P(AB1)+P(AB2)+…,再由条件概率公式P(ABi)=P(Bi)P(A|Bi),得到:
    P(A) = P(B1)P(A|B1)+P(B2)P(A|B2)+…
    上述公式就称为全概率公式
  3. 全概率公式的理论和实际意义在于:当复杂情况下A的概率P(A)不容易计算,但A总是随某个Bi伴出,适当去构造一组Bi往往可以简化计算。

老猿注:全概率公式中Bi可以看做事件A发生的原因,因此全概率公式可以看作是由原因的概率推结果的概率。

十、贝叶斯公式

10.1、贝叶斯公式的定义

设B1、B2、…为完备事件群,对任一事件A,结合条件概率的定义有:

P(Bi|A)=P(ABi)/P(A)=P(Bi)P(A|Bi) / (P(B1)P(A|B1)+P(B2)P(A|B2)+…)=P(Bi)P(A|Bi) / (ΣP(Bj)P(A|Bj))

上述公式就称为贝叶斯公式,是英国学者T·贝叶斯提出的。

10.2、贝叶斯公式的意义

贝叶斯公式中的事件A可以看作已经发生的事件,Bi可以看做事件A发生的原因,因此贝叶斯公式可用于在A发生的情况下,去找各个原因导致事件A发生的概率,这个概率与P(Bi|A)成比例。

10.3、例1

有三个盒子C1、C2、C3,各有100个球,其中C1盒含白球80个、红球10个、黑球10个;C2为白球10个、红球80个、黑球10个;C3为白球10个、红球10个、黑球80个,现从这三个盒子中随机地抽出一个(每盒被抽的概率为1/3),然后从所抽出的盒中随机抽出一个球(每球被抽的概率为0.01),结果抽出者为白球。问“该白球是从Ci盒中抽出”的可能性有多大(i=1,2,3)?

解:
记Bi={抽出的为Ci盒}(i=1,2,3),A={抽出白球},要求的是条件概率P(Bi|A)。按假定,有
P(B1)=P(B2)=P(B3)=1/3,
P(A|B1)=0.8,P(A|B2)=0.1,P(A|B3)=0.1
代入贝叶斯公式,算出分母:P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)=1/3*(0.8+0.1+0.1)=1/3,其实从300个球中抽100个球的概率就是1/3,因此可以算得:
P(B1|A)=0.8,P(B2|A)=0.1,P(B3|A)=0.1。

因为C1盒所含白球最多,故在已知抽出白球的情况下,该球系来自C1盒的可能性也最大,理所当然。可能仍有读者不完全了然于心,则可以设想这么一个试验,准备两张纸,把例中的试验一次又一次地做下去:每抽出一个盒,在左边的纸上记下其为C1或C2或C3(不管从该盒中抽出的球如何);而只有在抽出的球为白球时,才在右边的纸上记下该盒为C,或C2或C3。在进行了极大量次数的试验后,会发现左边纸上C1的比例很接近1/3,而在右边纸上C1的比例则很接近0.8。

10.4、例2

设某种病菌在人口中的带菌率为0.03,当检查时,由于技术及操作的不完善以及种种特殊原因,使带菌者未必检出阳性反应而不带菌者也可能呈阳性反应。
假定: P(阳性|带菌)=0.99,P(阴性|带菌)=0.01, P(阳性|不带菌)=0.05,P(阴性|不带菌)=0.95。
现设某人检出阳性,问“他带菌”的概率是多少?

此问题相当于 P(B1)=0.03,P(B2)=0.97,且P(A|B1)=0.99,P(A|B2)=0.05,所求的概率为P(B1|A),按贝叶斯公式算出:
P(B1|A) = P(B1)P(A|B1)/( P(B1)P(A|B1)+ P(B2)P(A|B2)) = (0.03)(0.99)/[(0.03)(0.99)+(0.97)(0.05)]=0.380。

也就是说,即使你检出阳性,尚可不必过早下结论你一定带菌了。实际上,这种可能性尚不到40%。
这个例子很值得玩味,且对其“思维定势”中无概率成分的人来说,简直有点难以置信.说穿了,理由简单之极,由于带菌率极低,在全人口中绝大部分不带菌。由于检验方法的不完善,在这大批人中会检出许多呈阳性者。另一方面,带菌者在全人口中很少,即使检测出阳性,在这两部分阳性的人群中占比相对较少,属于虚报性质,因此提高精度在这类检验中非常重要。

小结

本文结合陈希孺老先生的概率论教材介绍了事件的互斥、独立的概念,概率的运算法则,互斥事件的加法定理、独立事件的乘法定理以及条件概率的定义以及由此推导出来的完备事件群的全概率公式和贝叶斯公式,最后介绍了贝叶斯公式在解决实际问题中的应用。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能数学基础--概率与统计9:概率运算、加法公理、事件的独立性、概率乘法定理、条件概率、全概率公式以及贝叶斯公式 的相关文章

随机推荐

  • 国际带宽市场的发展趋势和前景

    随着全球互联网的不断普及和云计算 人工智能等新技术的迅猛发展 国际带宽市场在不断扩大 成为了全球信息通信领域的重要组成部分 本文将就国际带宽市场的发展趋势和前景进行探讨 一 市场概况 国际带宽是指一个国家或地区连接国际互联网所拥有的带宽资源
  • VMware Workstation Pro 16.2.4安装教程

    VMware Workstation Pro 16 2 4 安装教程 文章目录 VMware Workstation Pro 16 2 4 安装教程 下载最新版VMware 双击打开 自定义安装位置 把 去掉 点击下一步 等待安装 点击许可
  • 主从服务器 共用文件,Docker+keepalived+nginx实现主从热备的方法示例

    前言 为解决单点故障 我们需要配置主从热备方案 服务器数量有限 故使用Docker模拟安装配置 本次配置默认已经安装了Docker 配置环境 centos7 64位 docker版本 Docker version 17 12 1 ce bu
  • Apache Storm之集群安装

    1 环境 storm 1 2 1 Java 7 storm 1 x对java 7 和 java 8均进行了测试 Pytho 2 6 6 Python 3 x理论上也可以 但是并不作为storm的测试 以上是storm的环境 如果不匹配的ja
  • python-异常处理汇总

    1 需求 当程序遇到问题时 不让程序结束 而越过错误继续向下执行 格式 try 语句t except 错误码 语句1 except 错误码 语句2 except 错误码 语句3 except 错误码 语句n else 语句e 注意 else
  • 数字IC秋招面试专题(二)verilog的signed和unsigned

    数字IC秋招面试专题 二 verilog的signed和unsigned 前言 一 右值按signed还是unsigned 二 signed的自动扩位 三 系统函数 signed 和 unsigned 总结 声明 未经作者允许 禁止转载 推
  • ​【UI界面】Foobar2000 FlatLite 整合版

    Foobar2000 是一款本地音乐播放器 这里我就不再做介绍了 不懂的请自行了解 此 Foobar2000 FlatLite 主题包为整合版本 下载既可用 主题界面是模块化的 JS 面板 每个面板都是独立的 面板里的图标也是由 JS 脚本
  • JAVA字符串的两种定义方式的区别

    关于JAVA中两种字符串定义方式的区别 第一次写 就当复习总结一下 希望能帮到需要的人吧 我们知道在JAVA中 对于字符串的实例化方式有两种 直接赋值 String str Hello World 构造方法实例化 String str ne
  • 编写dylib_如何使用第三方的dylib

    展开全部 所谓dylib 就是bsd风格的动态库 基本可以认为等价于e5a48de588b63231313335323631343130323136353331333339663331windows的dll和linux的so mac基于bs
  • car

    本篇介绍如何检验回归结果是否符合模型假设 以及样本中是否存在异常点 本篇使用的主要工具包是car 包名是Companion to Applied Regression的缩写 该包提供了许多用于模型检验的函数 初始模型如下 library c
  • HTML快速参考指南

    目录 HTML 基础文档 文本元素 逻辑样式 物理样式 链接 锚 图像元素 无序列表 有序列表 定义列表 表格 框架 表单 实体 其他元素 HTML 基础文档 Visible text goes here 文本元素 p This is a
  • windows下编写shell脚本完美解决换行问题$'\r': command not found

    前面已经写过另外一边关于解决编写shell脚本换行的问题 即在Linux下执行命令 sed i s r g 文件名称 比如 sed i s r g host1 sh 今天是另外一种方式解决 使用ultraEdit软件编写shell脚本 新建
  • 【mysql】出现 slow sql 问题及建议

    文章目录 1 SQL 执行什么情况下会变慢 2 影响 SQL 语句执行效率的主要因素有哪些 3 慢 SQL 是如何拖垮数据库的 4 最佳实践建议 1 SQL 执行什么情况下会变慢 数据量增加 数据库中的数据量可能会逐渐增加 导致查询变慢 查
  • Python 常用写法

    时间 1 now import datetime now datetime now nowStr now strftime now Y m d H M S list 1 分割最后一个 arr str rsplit 1 2 数组 加索引 en
  • 学习C++项目——select模型,poll模型和epoll模型

    学习计算机网络编程 一 思路和学习方法 本文学习于 C语言技术网 www freecplus net 在 b 站学习于 C 语言技术网 并加以自己的一些理解和复现 如有侵权会删除 接下来应该是网络编程部分最难也是最常用的部分 同时在这一章我
  • 系统分析与设计——UML图总结

    一 前言 期末考试之前 我复习系统分析与设计的时候对UML图做了一些知识汇总 现在放到博客上 如果有不对或不恰当的地方 欢迎各位指正 本文仅仅起记录作用 可随意转载 荣幸之至 截图来自网络或是老师的PPT 二 概述 系统模型的三个主要部分
  • flutter 键盘挡住输入框问题

    bool isShowKeyboard false double keyboardSize 260 软键盘高度 类添加with WidgetsBindingObserver 生命周期监听器 class SendRedEveDialogSta
  • 浏览器上实现CNN可视化——清楚看到每一层卷积后的图

    目录 本文作用 CNN神经网络可视化工具1 解释器学习笔记 CNN神经网络可视化工具2 本文作用 学习卷积神经网络时 我们只知道输入一张图片后 通过一顿操作 便可以提取图片中的特征 我们对于其内部的操作 只有理论了解 并没有做到眼见为实 这
  • 使用cloudflare tunnel免费内网穿透,实现网站的外网访问和远程桌面

    前言 Cloudflare Tunnel是Cloudflare Zero Trust中的一个产品 它能够帮助用户将位于内网中的服务暴露到公网上 从而使得外部用户可以通过互联网访问这些服务 相比较于frp ngrok等内网穿透工具 使用Clo
  • 人工智能数学基础--概率与统计9:概率运算、加法公理、事件的独立性、概率乘法定理、条件概率、全概率公式以及贝叶斯公式

    一 概述 这大半年都很忙 学习时间太少 导致概率论的学习停滞不前 期间AI大佬herosunly推荐了陈希孺老先生的概率论教材 与最开始学习的美版M R 斯皮格尔等著作的 概率与统计 表示差异比较大 具体请见 人工智能数学基础 概率与统计7