人工智能数学基础--概率与统计10:离散随机变量的概率函数及常见的二项分布、泊松分布

2023-11-08

一、离散随机变量的概率函数及分布函数

  1. 设X为离散随机变量,其全部可能取值为{a1,a2,…},则:pi=P(X=ai)
    (i=1,2,…)称为X的概率函数,也称为随机变量X的概率分布

  2. 设X为随机变量(包括离散和非离散),则函数:P(X≤x) = F(x) (-∞ < x <∞) 称为X的分布函数

  3. 结合概率函数和分布函数的定义,对于离散随机变量,有: P(i) = P(X=i) = F(i)-F(i-1);

  4. 对任何随机变量X,其分布函数F(x)是单调非降的,且X->∞时,F(x)->1,X->-∞时,F(x)->0。

二、二项分布

2.1、定义

假设某事件A在一次试验中发生的概率为p,将该试验独立重复n次,以X记A在试验中发生的次数,X取值范围为0,1,…,n,考虑事件{X=i}出现的概率pi(表示X=i时的概率),则有:
在这里插入图片描述
X所遵循的上述公式分布称为二项分布,常记为B(n,p),X服从二项分布记为:X ~ B(n,p) 。之所以成为二项分布,是因为该概率与(a+b)n 的二项式展开系数相同。

2.2、证明

重复试验n次,事件发生概率为p,发送i次,则未发生次数为n-i次,其每次的概率为1-p,由于事件发生i次时,对于不同的顺序有不同组合,因此发生i次的概率即为B(n,p)。

2.3、二项分布的两个条件

上述二项分布的定义中隐含了两个二项分布的条件,这也是二项分布使用的两个重要条件:

  1. 各次试验的条件是稳定的,即有稳定的概率p在各次试验中保持不变;
  2. 各次试验的独立性。

例如产品的废品率在同样的生产条件下应该是固定的,做废品率检测时,抽取的产品每次抽检后放回,则认为抽检是独立的,其概率会服从二项分布。但如果不放回,则不是独立的,因为抽检减少的数量会影响到下次抽检,如果此时抽检数量远少于产品总数,也可以近似认为是独立的,仍近似服从二项分布。

三、泊松分布

3.1、定义

若随机变量X的可能取值为0、1、2、…,且概率分布为:P(X=i)=eλi/i! ,则称X服从泊松分布,常记为:X~P(λ),注意此处的λ要求为大于0的常数。

3.2、泊松分布概率函数的推导

泊松分布适用于表示一定时间或空间内出现的事件个数,如一定时间范围内某交通路口的事故数。假设观察的时间段为[0,1),取一个很大的自然数n,将[0,1)等分成n段,标记为l1、l2、…,则:
l1=[0,1/n),l2 = [1/n,2/n),…,li = [(i-1)/n,i/n),…,ln=[(n-1)/n,1)
做几个假定:

  1. 在每段li内,恰发生一个事故的概率近似地与这段的时间长1/n成正比,即可取为λ/n。又假定n很大每段时间很小时,在一段时间内最多只发生一次事故,则不发生事故的概率为1-λ/n;
  2. 在每段时间内是否发生事故是独立的。

按照上述假定,则可以把在[0,1)内发生事故的次数X视作在n个时段内有事故的时段数,且其服从二项分布B(n,λ)。于是P(X=i) = B(n,p)=b(i;n,p),即:

在这里插入图片描述
当n->∞时:
在这里插入图片描述
因此可以得到:P(X=i) = ( i n ) ( λ n ) i ( 1 − λ n ) n − i → e − λ λ i / i ! ^n_i)(\frac{λ}{n})^i(1-\frac{λ}{n})^{n-i} →e^{-λ}λ^i/i! in)(nλ)i(1nλ)nieλλi/i!

老猿注:上图中这两个极限的值对于忘记极限知识的人来说推导还是要花点时间的,如果不清楚的请参考《由二项分布推导泊松分布中的两个使用公式的证明:https://blog.csdn.net/LaoYuanPython/article/details/127877254》。

3.3、泊松分布使用场景

上面已经介绍泊松分布适用于表示一定时间或空间内出现的事件个数,从上面的推导过程可以看到,泊松分布可以作为二项分布的极限得到,一般地说,如果X~B(n,p),其中n很大,p很小,而np=λ不太大时,则X的分布接近于泊松分布P(λ)。有此基础,则可以将一些满足上面条件的二项分布转换为泊松分布去计算。

我们来看一个例子:
现在需要100个符合规格的元件。从市场上买的该元件有废品率0.01,故如只买100个,则它们全都符合规格的机会恐怕不大,为此我们买100+a个,a这样取,以使“在这100+a个元件中至少有100个符合规格”这个事件 A 的概率不小于0.95。问a至少要多大?

解答

在此假定各元件是否合格是独立的,以X记在这100+a个元件中所含的废品数,则X有二项分布B(100+a,0.01)。
事件A 即事件(X≤a}于是A的概率为:
P ( A ) = ∑ i = 0 a P ( X = i ) = ∑ i = 0 a ( i 100 + a ) ( 0.01 ) i ( 0.99 ) 100 + a − i P(A)=\sum\limits_{i=0}^a P(X=i)=\sum\limits_{i=0}^a(^{100+a}_{\quad i})(0.01)^i(0.99)^{100+a-i} P(A)=i=0aPX=i=i=0a(i100+a)(0.01)i(0.99)100+ai

为确定最小的a使P(A)≥0.95,得从a=0开始对a=0,1,2,···依次计算上式右边的值,直到算出≥0.95的结果为止,这很麻烦。
由于100+a 这个数较大而0.01很小,(100+a)(0.01)=1+a(0.01)大小适中,可近似地用泊松分布计算。
由于平均在100个产品中只有1个废品,a谅必相当小,故可以用1近似地取代1+a(0.01)。由此X近似地服从泊松分布P(1)。
因而
P ( X ≤ a ) ≈ ∑ i = 0 a e − 1 / i ! P(X≤a) ≈ \sum\limits_{i=0}^ae^{-1}/i! P(Xa)i=0ae1/i!
计算出当a=0,1,2,3时,上式右边分别为0.368.0.736.0.920 和0.981。故取a=3已够了。

四、小结

本文介绍了离散随机变量的概率函数、概率分布的定义,并介绍了两个很重要的离散随机变量的概率分布:二项分布和泊松分布,实际上泊松分布是二项分布的极限形式。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能数学基础--概率与统计10:离散随机变量的概率函数及常见的二项分布、泊松分布 的相关文章

随机推荐

  • Python数据分析实战(3)Python实现数据可视化

    文章目录 一 数据可视化介绍 二 matplotlib和pandas画图 1 matplotlib简介和简单使用 2 matplotlib常见作图类型 3 使用pandas画图 4 pandas中绘图与matplotlib结合使用 三 订单
  • 出现次数最多的数CSP201312-1(简单c语言解法)

    问题描述 给定n个正整数 找出它们中出现次数最多的数 如果这样的数有多个 请输出其中最小的一个 输入格式 输入的第一行只有一个正整数n 1 n 1000 表示数字的个数 输入的第二行有n个整数s1 s2 sn 1 si 10000 1 i
  • Linux中ssh基于密匙的安全验证过程是怎样的?

    在Linux中 ssh是非常重要的存在 但很多人对 ssh 这个概念很模糊 听起来也很晦涩难懂 那么Linux ssh是什么 有什么用 这篇文章为你解答一下 SSH是一种协议 SSH是较可靠 专为远程登录会话和其他网络服务提供安全性的协议
  • BufferedImage 基本操作

    1 创建一个图片 并且写入文件 BufferedImage grayImage new BufferedImage 512 512 BufferedImage TYPE INT ARGB ImageIO write grayImage jp
  • 利用函数求数组[5,2,99,101,67,77]中的最大值

  • 后台开发工具篇之xampp

    一 解决问题 在进行后台开发时 我们很多时候都需要先在本地编写与调试代码 这就需要我们首先在本地搭建服务器开发环境 但是 搭建过的朋友应该知道 环境的搭建可不是三两步就可以搞定的 举例来说 如果我们要在本地Windows环境中搭建PHP服务
  • 图像预处理——CV

    目录 1 图像预处理 1 1 图像显示与存储原理 1 2 图像增强的目标 1 3 点运算 基于直方图的对比度增强 1 4 形态学处理 1 5 空间域处理 卷积 1 6 卷积的应用 平滑 边缘检测 锐化等 1 7 频率域处理 傅里叶变换 小波
  • 薪资12k,在银行外包做软件测试是一种什么体验...

    背景 本人普通二本本科毕业 4 年 目前是在广州工作 是一家大型的人力外包公司外包到银行的开发人员 这可能也是长期在各大招聘软件上最积极的招聘岗位 从入职到现在已经有四个月了 也大概了解了外包的主要工作情况 也有了一些心得体会 借此机会也简
  • 【解决】NullReferenceException: Object reference not set to an instance of an object

    游戏引擎 Unity 版本 2019 4 6f1 2017版本以上均可 编译平台 Visual Studio 2019 一 问题描述 描述 原 文 报错 NullReferenceException Object reference not
  • IT云运维技术分享

    1 运维体系 1 1 市场对运维的需求 时代发展到今天 社会的生活方式与生产方式的全面的数字化 无论是传统企业还是互联网企业 都在全面上云 这也意味着企业的关键业务乃至 身家性命 都已经全部放在 IT 系统之上 因此企业需要系统足够稳定可靠
  • python37-32_python37.dll文件 免费版

    python37 dll文件是一款非常重要的系统文件 你还在为python37 dll文件缺失出错而苦恼吗 小编推荐你使用这款软件 它可以帮助大家修复因为缺失python37 dll引起的一场和报错 只需要在本站下载压缩包解压后安装在指定文
  • 神经网络-Unet网络

    文章目录 前言 1 seq2seq 编码后解码 2 网络结构 3 特征融合 4 前言 Unet用来做小目标语义分割 优点 网络结构非常简单 大纲目录 2016年特别火 在细胞领域做分割特别好 1 seq2seq 编码后解码 2 网络结构 几
  • H - Hiking trip Gym - 103577H

    题目链接 题意 题意很简单就是模拟一个过程 但是模拟很复杂错了很多次 下面是AC代码 include
  • Unity脚本开发基础

    1 打开工程 Assets中新建文件夹Scripts 在文件夹中右键Create C 创建完毕 双击脚本 打开IDE 注意 类名和脚本名要是一样的 Start函数 在其中的内容会在一开始就被执行 所以一些需要初始化的变量写在其中 Updat
  • GitLab 与 SourceTree的结合使用

    这里写自定义目录标题 为公司分配的GitLab账号 重置密码 为GitLab添加公钥 第一步 创建ssh 第二部 为GitLab添加ssh 下载sourcetree 这里我们点击Bitbucket进行授权登陆 不登陆安装工具会很慢还有可能出
  • MySQL数据库的介绍

    数据库简介 数据库指的是长期存在计算机内 有组织 可共享 大量数据的集合 数据是按照特定的数据模型来组织 存储在数据库中 数据库的好处 1 持久化数据到本地 2 可以实现结构化查询 方便管理 数据库相关概念 DB database 数据库
  • 第二天(八)osg::Object* readObjectFile(const std::string& filename,const ReaderWriter::Options* options)

    目前流程是 osgViewer viewBase frame viewerInit 创建帧事件 并将漫游器与事件和视口相关联 gt osgViewer Viewer ViewerInit gt osgViewer View Init gt
  • whatweb

    Whatweb介绍 Whatweb是一个基于Ruby语言的开源网站指纹识别软件 正如它的名字一样 whatweb能够识别各种关于网站的详细信息包括 CMS类型 博客平台 中间件 web框架模块 网站服务器 脚本类型 JavaScript库
  • flutter 创建插件遇到的两个问题,一:右键Flutter菜单不可用,二:可用后,iOS工程打开没有pods目录。

    今天研究flutter 插件 按照教程 通过android studio 创建 flutter 插件 创建完成后 点击工程右键 弹出菜单中Flutter 项目为灰色 不可用 升级flutter AndroidStudio都未解决 flutt
  • 人工智能数学基础--概率与统计10:离散随机变量的概率函数及常见的二项分布、泊松分布

    一 离散随机变量的概率函数及分布函数 设X为离散随机变量 其全部可能取值为 a1 a2 则 pi P X ai i 1 2 称为X的概率函数 也称为随机变量X的概率分布 设X为随机变量 包括离散和非离散 则函数 P X x F x lt x