贝叶斯推断及其互联网应用（一）

2023-11-07

贝叶斯推断及其互联网应用（一）

投递人 itwriter 发布于 2011-08-25 14:03 评论(6) 有1981人阅读原文链接 [收藏] « »

一年前的这个时候，我正在翻译Paul Graham的《黑客与画家》。

那本书大部分谈的是技术哲学，但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件（英文版）？

说实话，我没完全看懂那一章。那时，交稿截止日期已经过了，没时间留给我去啃概率论教科书了。我只好硬着头皮，按照字面意思把它译了出来。虽然交稿了，译文质量也还可以，但是心里很不舒服，下决心一定要搞懂它。

一年过去了，我读了一些概率论文献，逐渐发现贝叶斯推断并没有想象的那么难。相反的，它的原理部分实际上很容易理解，甚至不需要用到高等数学。

下面就是我的学习笔记。需要声明的是，我并不是这方面的专家，数学其实是我的弱项。所以，欢迎大家提出宝贵意见，让我们共同学习和提高。

=====================================

贝叶斯推断及其互联网应用

作者：阮一峰

一、什么是贝叶斯推断

贝叶斯推断（Bayesian inference）是一种统计学方法，用来估计统计量的某种性质。

它是贝叶斯定理（Bayes' theorem）的应用。英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年发表的一篇论文中，首先提出了这个定理。

贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上，也就是说，你可以不需要客观证据，先估计一个值，然后根据推断结果不断修正。正是因为它的主观性太强，曾经遭到许多统计学家的诟病。

贝叶斯推断需要大量的计算，因此历史上很长一段时间，无法得到广泛应用。只有等到计算机诞生以后，它才获得真正的重视。人们发现，许多统计量是无法事先进行客观判断的，而互联网时代出现的大型数据集，再加上高速运算能力，为验证这些统计量提供了方便，也为应用贝叶斯推断创造了条件，它的威力正在日益显现。

二、贝叶斯定理

要理解贝叶斯推断，就必须先理解贝叶斯定理。后者实际上就是计算"条件概率"的公式。

所谓"条件概率"（Conditional probability），就是指在事件B发生的情况下，事件A发生的概率，用P(A|B)来表示。

根据文氏图，可以很清楚地看到在事件B发生的情况下，事件A发生的概率就是P(A∩B)除以P(B)。

因此，

同理可得，

所以，

即

这就是条件概率的计算公式。

三、全概率公式

由于后面要用到，所以除了条件概率以外，这里还要推导全概率公式。

假定样本空间S，是两个事件A与A'的和。

上图中，红色部分是事件A，绿色部分是事件A'，它们共同构成了样本空间S。

在这种情况下，事件B可以划分成两个部分。

即

在上一节的推导当中，我们已知

所以，

这就是全概率公式。它的含义是，如果A和A'构成样本空间的一个划分，那么事件B的概率，就等于A和A'的概率分别乘以B的条件概率之和。

将这个公式代入上一节的条件概率公式，就得到了条件概率的另一种写法：

四、贝叶斯推断的含义

对条件概率公式进行变形，可以得到如下形式：

我们把P(A)称为"先验概率"（Prior probability），即在B事件发生之前，我们对A事件概率的一个判断。P(A|B)称为"后验概率"（Posterior probability），即在B事件发生之后，我们对A事件概率的重新评估。P(B|A)/P(B)称为"可能性函数"（Likelyhood），这是一个调整因子，使得预估概率更接近真实概率。

所以，条件概率可以理解成下面的式子：

这就是贝叶斯推断的含义。我们先预估一个"先验概率"，然后加入实验结果，看这个实验到底是增强还是削弱了"先验概率"，由此得到更接近事实的"后验概率"。

在这里，如果"可能性函数"P(B|A)/P(B)>1，意味着"先验概率"被增强，事件A的发生的可能性变大；如果"可能性函数"=1，意味着B事件无助于判断事件A的可能性；如果"可能性函数"<1，意味着"先验概率"被削弱，事件A的可能性变小。

五、【例子】水果糖问题

为了加深对贝叶斯推断的理解，我们看两个例子。

第一个例子。两个一模一样的碗，一号碗有30颗水果糖和10颗巧克力糖，二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗，从中摸出一颗糖，发现是水果糖。请问这颗水果糖来自一号碗的概率有多大？

我们假定，H1表示一号碗，H2表示二号碗。由于这两个碗是一样的，所以P(H1)=P(H2)，也就是说，在取出水果糖之前，这两个碗被选中的概率相同。因此，P(H1)=0.5，我们把这个概率就叫做"先验概率"，即没有做实验之前，来自一号碗的概率是0.5。

再假定，E表示水果糖，所以问题就变成了在已知E的情况下，来自一号碗的概率有多大，即求P(H1|E)。我们把这个概率叫做"后验概率"，即在E事件发生之后，对P(H1)的修正。

根据条件概率公式，得到

已知，P(H1)等于0.5，P(E|H1)为一号碗中取出水果糖的概率，等于0.75，那么求出P(E)就可以得到答案。根据全概率公式，

所以，

将数字代入原方程，得到

这表明，来自一号碗的概率是0.6。也就是说，取出水果糖之后，H1事件的可能性得到了增强。

六、【例子】假阳性问题

第二个例子是一个医学的常见问题，与现实生活关系紧密。

已知某种疾病的发病率是0.001，即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病，它的准确率是0.99，即在患者确实得病的情况下，它有99%的可能呈现阳性。它的误报率是5%，即在患者没有得病的情况下，它有5%的可能呈现阳性。现有一个病人的检验结果为阳性，请问他确实得病的可能性有多大？

假定A事件表示得病，那么P(A)为0.001。这就是"先验概率"，即没有做试验之前，我们预计的发病率。再假定B事件表示阳性，那么要计算的就是P(A|B)。这就是"后验概率"，即做了试验以后，对发病率的估计。

根据条件概率公式，

用全概率公式改写分母，

将数字代入，

我们得到了一个惊人的结果，P(A|B)约等于0.019。也就是说，即使检验呈现阳性，病人得病的概率，也只是从0.1%增加到了2%左右。这就是所谓的"假阳性"，即阳性结果完全不足以说明病人得病。

为什么会这样？为什么这种检验的准确率高达99%，但是可信度却不到2%？答案是与它的误报率太高有关。（【习题】如果误报率从5%降为1%，请问病人得病的概率会变成多少？）

有兴趣的朋友，还可以算一下"假阴性"问题，即检验结果为阴性，但是病人确实得病的概率有多大。然后问自己，"假阳性"和"假阴性"，哪一个才是医学检验的主要风险？

===================================

关于贝叶斯推断的原理部分，今天就讲到这里。下一次，将介绍如何使用贝叶斯推断过滤垃圾邮件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

拾起高数

贝叶斯推断及其互联网应用（一）的相关文章

海森矩阵及其应用

海森矩阵及其应用转载 2017年04月20日 09 59 48 标签梯度下降算法微积分牛顿迭代法原文参考链接 here 原文讲得到很详细海森矩阵在数学中海森矩阵 Hessian matrix或Hessian 是一个自变量为向
离散余弦变换

离散余弦变换 DCT for Discrete Cosine Transform 是与傅里叶变换相关的一种变换它类似于离散傅里叶变换 DFT for Discrete Fourier Transform 但是只使用实数离散余弦变换相当于
贝叶斯推断及其互联网应用（二）：过滤垃圾邮件

上一次我介绍了贝叶斯推断的原理今天讲如何将它用于垃圾邮件过滤贝叶斯推断及其互联网应用作者阮一峰接上文七什么是贝叶斯过滤器垃圾邮件是一种令人头痛的顽症困扰着所有的互联网用户正确识别垃圾邮件的技术难度非常大传统的垃圾邮件
证明sinx/x的极限等于1（x趋向于0）

洛比达法则上下都对x求导得1 cosx 1
逆矩阵(inverse matrix)的概念及其意义

逆矩阵 inverse matrix 的概念及其意义 2015年09月17日 00 09 10 阅读数 21838 标签逆矩阵为何需要逆矩阵逆矩阵应用逆矩阵实例逆矩阵与倒数更多版权声明本文为博主原创文章未经博主允许不得转载 htt
时域和空域和频域

傅立叶变换是f t 乘以正弦项的展开正弦项的频率由u 其实是miu 的值决定因为积分后左边剩下的为一变量是频率所以我们说傅立叶变换域是频率域数字图像处理冈萨雷斯中文第三版P128 当变量t用于说明图像时我们一般将变量t的域称为
极限导数练习题

f x sinx 2 x 当x趋近于0时 f x 的极限是0 f x sin x 2 x 当x趋近于0时 f x 的极限是0 f x sin 2x x 当x趋近于0时 f x 的极限是2
python 之pulp 线性规划介绍及举例

原文 https www cnblogs com shizhenqiang p 8274806 html 安装 conda install pulp pulp http pythonhosted org PuLP main basic py
凸函数性质习题

试题专页 1题文考试题提前练 gt 戳这凸函数的性质定理为如果函数f x 在区间D上是凸函数则对于区间D内的任意x1 x2 xn 有 f x1 f x2 f xn n f x1 x2 xn n 已知函数y sinx在区间 0 上是凸
贝叶斯推断及其互联网应用（一）

贝叶斯推断及其互联网应用一投递人 itwriter 发布于 2011 08 25 14 03 评论 6 有1981人阅读原文链接收藏一年前的这个时候我正在翻译Paul Graham的黑客与画家那本书大部分谈的是技术哲学但是
相关系数，互相关函数，协方差，卷积

X t 为随机过程 a t E X t 为期望 Y t 为另一随机过程自相关函数的定义为 R s t E X s X t 互相关函数的定义为 R s t E X s Y t 事实上在图象处理中自相关和互相关函数的定义如下设原函数是f
函数的相关和卷积

1 卷积的定义卷积满足交换律分配律结合律也具有位移不变性以及缩放性质 2 互相关的定义变量替换后有上述两式完全等价性质 1 互相关是两个函数间存在相似性的量度 2 由上述 2 式可得 3 相关运算和卷积运算的区别对相关来说
世界上最完美的公式 ----欧拉公式

欧拉公式在数学历史上有很多公式都是欧拉 leonhard euler 公元1707 1783年发现的它们都叫做欧拉公式它们分散在各个数学分支之中 1 分式里的欧拉公式 a r a b a c b r b c b a c r c a
线性回归最小二乘法和梯度下降法-详细

原文 https blog csdn net y990041769 article details 69567838 问题描述首先我们定义问题线性回归要解决的问题就是根据给出的数据学习出一个线性模型例如我们最常说的身高和体重的关系以
java实现高斯赛德尔算法解线性方程组

package linear equation import java util Scanner 使用高斯赛德尔迭代法求解线性方程组 public class Gauss Seidel Iterate 求下三角 private static
自然对数e的来历

e是自然对数的底数是一个无限不循环小数其值是2 71828 是这样定义的当n gt 时 1 1 n n的极限注 x y表示x的y次方随着n的增大底数越来越接近1 而指数趋向无穷大那结果到底是趋向于1还是无穷大呢其实是趋向于
对数和指数

参考 https www zhihu com question 21453993 这就相当于先发明减法符号再发明加法符号 1614年纳皮尔发明了对数和对数表 1637年法国数学家笛卡儿发明了指数比对数晚了20多年 1770年欧拉才
2的31次方和3的21次方哪个大，123组成最大的数是多少？

123这三个数字组成最大的数是什么数面试官告诉小孙 123这三个数字组成最大的数是什么数我希望你能够在5分钟之内回答出来小孙当时连想都没有想 123组成的最大数字当然就是123了当小孙把这个答案告诉面试官的时候面试官摇摇头然后
特征值和特征向量的几何和物理意义

原文 http blog 163 com renguangqian 126 blog static 1624014002011711114526759 FUCk 相见很晚如果大学期间遇到这样的文章线代必须90分以上特征值和特征向量的几
协方差矩阵的实例与意义

协方差矩阵的实例与意义在机器学习中经常需要计算协方差矩阵本科时没学过这个概念一直对此非常头疼现在试图通过实例的计算图形化的表示来梳理一下什么是协方差矩阵 A numerical example 问题有一组数据如下分别为二维向

随机推荐

什么是HTTPS

首先在参考 Tomcat内核设计剖析大型网站技术架构的基础上加了一些个人理解如有错误或者不全面的地方还请大家指出在知道什么是HTTPS之前我们首先要知道一下什么是HTTP HTTP是超文本传输协议的简称工作在应用层传输层基
linux上好玩的东西

Figlet 想知道tmux安装与配置评论加点赞想要我这个效果吗安装figlet mac安装 brew install figlet brew 没有的可以看我之前的文章 ma配置 linux ubuntu deepin sudo apt
最易上手的测试用例设计方法

NO 1 lt lt 测试用例设计方法 gt gt 以下是八种常见的测试用例设计方法包括等价类边界值判定表因果图正交实验状态迁移图场景法和错误推测详述如下等价类划分法 Equivalence Partitioning 策略
C++新特性16_写时拷贝(解决浅拷贝在某一个类对象中的资源进行修改，所有引用该资源的对象全部会被修改的问题；解决办法：在所有改变值的地方，重新分配内存，改变的是拷贝的值，而不影响原有对象中共享资源)

C 新特性16 写时拷贝 1 问题如果共享资源中的值发生了变化那么其他使用该共享资源的值如何保持不变 2 解决思路使用引用计数时当发生共享资源值改变的时候需要对其资源进行重新的拷贝这样改变的是拷贝的值而不影响原有的对象中的共享
母版页禁用Enter提交表单

在母版页里面由于使用了form 常常需要禁用enter提交表单因为内容页或者母版页自身有如果有type submit 的button 当textbox聚焦时按下enter都会触发表单的默认提交不论是IE还是firefox 于是需要在o
python json串合并

获取cookie def get login cookies self str1 str2 str3 str4 str5 str6 try 必须要有的cookie字段 var items bizuin data bizuin data ti
1*1卷积核的作用及其应用举例

1 降维和升维通过使用 1x1 卷积核可以改变输入张量的通道数当输入张量的通道数较大时使用 1x1 卷积核进行卷积操作可以将通道数减小从而降低模型的计算复杂度相反如果需要增加通道数也可以使用 1x1 卷积核进行升维操作 im
标签href几种使用

a标签的最重要功能是实现超链接和锚点 a标签里href属性是我们经常用的其实它的值有很多种可能我们往往会忽略今天分享一下a标签的属性值及用法 1 href 这是一个比较常用的方法是标签内置的一个方法用于网页返回顶部较多比如在底部
深度学习------tensorflow2.0，keras实现CNN（mnist、cifar2、cifar10:ResNet-34、ResNet-18）

1 ResNet 34卷积神经网络 cifar10 随着网络的加深出现了训练集准确率下降错误率上升的现象就是所谓的退化问题按理说更深的模型不应当比它浅的模型产生更高的错误率这不是由于过拟合产生的而是由于模型复杂时 SGD的优
qt day 5

实现局域网的网络聊天室功能 1 gt 服务器代码 widget h ifndef WIDGET H define WIDGET H include
IDEA安装教程（多图预警）

简介关于IDEA的介绍引用自百度百科 IDEA全称 IntelliJ IDEA 是java编程语言开发的集成环境 IntelliJ在业界被公认为最好的java开发工具尤其在智能代码助手代码自动提示重构 J2EE支持各类版本工具
集简云简化流程模板，轻松实现工作流程自动化

集简云平台内置大量自动化流程模板用户可以在模板中心搜索应用名称选择适合自己的场景直接使用本期分享集简云自动化工作流程模板推荐模板1 小鹅通新增订单后同步到seatable并更新微伴助手用户信息集成应用小鹅通 SeaTab
[终端配色方案]

配色方案一 Iterm2 设置Color Preferences gt Profiles gt Colors Brighten bold text去掉选择solarized 选择xterm 256color 二 Iterm2 Shell
Restful风格

文章目录前言一 Restful风格是什么二 Restful风格里面的请求方式 1 Get 2 POST 3 PUT 4 DELETE 这四个在项目接口中分别代表的是查增改删三 Restful风格的Controller如何实现
django静态文件无法访问解决方案

nginx配置如下 For more information on configuration see Official English Documentation http nginx org en docs Official Russi
开发日记2021-17、20周

2021 4 19 温习了下观察者模式学习了状态模式但是感觉状态模式不是太能把握透彻代码结构不太一样理解起来有些偏差写着写着就陷入到了沉思中总会忘记要把想法记下来这里就是草稿就是思路演练场这里写下的东西不需要完美只要记录下
【Clion+CubeMX开发STM32】（二）创建自己的工程

目录新建工程修改芯片型号添加自己的文件将自己的文件添加Cmake项目修改CMakeLists template txt 烧录程序编写 cfg文件编写 cfg文件新建工程打开你的Clion 点击新建工程在左侧找到STM32
期货开户寻找交易确定性

1 寻找确定性都说金融是概率游戏大家都是说胜率有多少没有谁敢说行情能100 确定但傅海棠却提出在特定情况下能找到100 确定的行情他的这个观点也一度引起了广泛的争议傅海棠说物极必反必是100 不是概率关键是找到那个
Unity3D之sprite动画（Animation）的制作

实例说明忍者跑酷的player动画制作这些都是用Sprite做的动画在prioject面板里的一组sprite里面点击之后看属性面板的Sprite Editor对这组Sprite进行编辑下面先编辑一个idle状态的动画首先选择第
贝叶斯推断及其互联网应用（一）

贝叶斯推断及其互联网应用一投递人 itwriter 发布于 2011 08 25 14 03 评论 6 有1981人阅读原文链接收藏一年前的这个时候我正在翻译Paul Graham的黑客与画家那本书大部分谈的是技术哲学但是

贝叶斯推断及其互联网应用（一）

贝叶斯推断及其互联网应用（一） 的相关文章

随机推荐

标签href几种使用

热门标签

贝叶斯推断及其互联网应用（一）的相关文章