【读书笔记->统计学】07-03 离散型概率分布-泊松分布概念简介

2023-11-06

泊松分布

假设一个情境:下星期电影院有一个大型促销,影院经理希望一切都完美无缺。爆米花机每一周的平均故障次数为3.4,或者说爆米花机的故障率为3.4。

求爆米花机下一周不发生故障的概率有多大?(如果预计故障太多次,就打算买个新的爆米花机了。)

与前面不同,这一次不存在一系列的试验,相反,这一次的情况是这样的:已知故障的发生几率,且该故障是随机发生的。

这一类问题的难点在于,尽管我们知道平均故障次数,但是实际的故障次数却不是固定的。从总体上看,我们可以期望的故障次数是每周3或4次,但在倒霉的某一周,故障会多得多,而在顺利的某一周,故障则根本不会发生。

泊松分布是专门应对这种情况的。

泊松分布的条件

  1. 单独时间在给定区间内随机、独立地发生,给定区间可以是时间或空间,例如可以是一个星期,也可以是一英里。
  2. 已知该区间内的事件平均发生次数(或者叫做发生率),且为有限数值。该事件平均发生次数通常用希腊字母 λ \lambda λ(lambda)表示。

让我们用X表示给定区间内的事件发生次数,例如一个星期内的损坏次数。如果X符合泊松分布,且每个区间内平均发生λ次,或者说发生率为λ,则写作:
X ∼ P o ( λ ) X \sim Po(\lambda) XPo(λ)
我们就不在这里进行推导了。在求给定区间内发生r次事件的概率时,请使用下式进行计算:
P ( X = r ) = e − λ λ r r ! P(X=r) = \frac{e^{-\lambda}\lambda^r}{r!} P(X=r)=r!eλλr
e是一个数学常数,一般为2.718,只要把这个数字代入泊松分布公式就行了。

如果X~Po(2),则:
P ( X = 3 ) = e − 2 ∗ 2 3 3 ! = 0.180 P(X=3) = \frac{e^{-2} * 2^3}{3!} = 0.180 P(X=3)=3!e223=0.180

柏松分布的期望和方差

如果X~Po(λ),则E(X)为我们在给定区间内能够期望的事件发生次数,对于爆米花机来说,则为我们在普通的一周内能够期望的机器损坏次数,也就是说,E(X)是给定区间内的事件平均发生次数。

现在,如果X~Po(λ),则事件平均发生次数以λ表示,则E(X)等于λ。同时,方差也是λ。
E ( X ) = λ V a r ( X ) = λ E(X) = \lambda \\ Var(X) = \lambda E(X)=λVar(X)=λ

柏松分布的形状

泊松分布的形状随着λ的数值发生变化。λ小,则分布向右偏斜,随着λ变大,分布逐渐变得对称。

如果λ是一个整数,则有两个众数λ和λ-1,如果λ不是整数,则众数为λ。

在这里插入图片描述

爆米花机例题:

在这里插入图片描述

问:泊松分布的公式是怎么来的?

答:实际上可以从其他公式推导出来,但会涉及很多数学知识。在实际应用中,最好的方法是记住这个公式及其应用条件。

问:泊松分布和其他概率分布有何差别?

答:主要差别是泊松分布不需要做一系列试验,但它描述了事件在特定区间内的发生次数。

组合泊松变量

假设一种情况:现在有爆米花机和饮料机,爆米花机每周发生故障的平均次数是3.4(X~Po(3.4)),饮料机每周发生故障的平均次数是2.3(Y~Po(2.3))。求下一周机器不出故障的概率。

如果X代表爆米花机每周发生故障的次数,Y代表饮料机每周发生故障的次数,则X和Y都符合泊松分布,另外,X和Y是相互独立的,即一方是否发生故障对另一方发生故障的概率没有影响。

我们需要求出下个星期故障总次数为0的概率,即:
P ( X + Y = 0 ) P(X+Y=0) P(X+Y=0)


因为X和Y是独立随机变量,则
P ( X + Y ) = P ( X ) + P ( Y ) E ( X + Y ) = E ( X ) + E ( Y ) P(X+Y) = P(X) + P(Y) \\ E(X+Y) = E(X) + E(Y) P(X+Y)=P(X)+P(Y)E(X+Y)=E(X)+E(Y)
即如果X~Po( λ x λ_x λx)且X~Po( λ y λ_y λy),则:
X + Y ∼ P o ( λ x + λ y ) X+Y \sim Po(\lambda_x + \lambda_y) X+YPo(λx+λy)
即,如果X和Y都符合泊松分布,则X+Y也符合泊松分布。也就是说,可以利用X+Y的分布情况求出X+Y的概率。

例题解答:

在这里插入图片描述

利用泊松分布近似二项分布

泊松分布还有一个用途:在特定条件下可以用来近似代替二项分布。这样可以方便计算,不用必须计算阶乘了(二项分布的公式中有组合 C n r C_n^r Cnr,n太大了会不好算)。

什么时候近似?

假设我们有一个变量X,且X~B(n,p),要求有这样一种条件:B(n,p)近似等于Po(λ)。

让我们首先研究两种分布的期望和方差。我们的目标是赵处泊松分布的期望和方差近似等于二项分布的期望和方差的情况,即希望:

在这里插入图片描述

当q近似等于1且n很大时,np和npq近似相等。即:

当n很大且p很小时,可以用X~Po(np)近似代替X~B(n,p)。

当n大于50且p小于0.1时,为典型的近似情况。

例题:

在这里插入图片描述

泊松分布总结

在这里插入图片描述

结束例题:

在这里插入图片描述

这道题我就是不理解为什么还多一个P(X=0)?

在这里插入图片描述

章节总结

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【读书笔记->统计学】07-03 离散型概率分布-泊松分布概念简介 的相关文章

随机推荐

  • 毕业论文找文献是个问题,我直接用python把全网文献爬了一遍,这波就很舒服

    文章目录 一 写在前面 二 准备工作 三 开始爬取 四 效果展示 一 写在前面 马上要毕业了兄弟们 毕业论文是个麻烦事 论文要的资料得一条一条去网上查看 那多浪费时间 咱直接写个爬虫 批量下载慢慢看 不舒服 二 准备工作 使用软件 Pyth
  • mysql char 和varchar的区别?

    char 和varchar的区别 1 char 一定会使用指定的空间 varchar是根据数据来定空间 2 char的插入数据效率理论上比varchar高 varchar是需要通过后面的记录数来计算 使用哪一种类型 如果确定数据一定是占指定
  • C++桌面端使用 zxing-cpp 和 opencv 生成二维码(带中间logo)

    一 环境工具准备 VS2019 Cmake zxing cpp 源代码 https gitee com asalmc zxing cpp opencv4 2 0 二 zxing cpp 编译 1 源码目录下新建build文件夹存放构建目录
  • EC20 配置DHCP客户端自动获取IP

    1 dnsmasq介绍 Dnsmasq为小型网络提供网络基础设施 DNS DHCP 路由器通告和网络引导 它被设计为轻量级且占用空间小 适用于资源受限的路由器和防火墙 它还被广泛用于智能手机和便携式热点的共享 并支持虚拟化框架中的虚拟网络
  • 特征训练、预测一致性管理工具:开源项目Feast

    在机器学习的流程大体可以分成模型训练和模型服务两个阶段 无论是训练和服务阶段 其实都需要进行特征工程相关的工作 这块的技术挑战就是如何保证训练和预测过程中使用的特征是一致的 这个问题困扰了很多机器学习从业者 比较典型的场景就是推荐场景 在推
  • phpstudy(小皮模板存在nginx解析漏洞)

    前言 好久没写文章了 最近比较忙 今天抽个空写点东西 phpstudy介绍 PhpStudy国内12年老牌公益软件 集安全 高效 功能与一体 已获得全球用户认可安装 运维也高效 支持一键LAMP LNMP 集群 监控 网站 数据库 FTP
  • IAR 软件激活步骤

    1 下载IAR软件 然后点击安装 一路NEXT 2 安装后激活 需要断网 3 打开IAR软件 在软件目录中点击help License manger 4 弹出IAR License manager界面 点击license offline a
  • 阿里云商标注册入口/查询/买卖/分类表/撤三/续展/驳回复审入口汇总一键直达

    阿里云商标服务包括商标注册申请 商标近似查询 商标买卖 商标分类表 商标撤三申请 商标续展申请 商标驳回复审 商标起名及商标管理后台等服务 阿里云百科汇总阿里云商标服务入口大全 本文长期更新阿里云商标注册各种链接地址 阿里云商标服务入口链接
  • matplotlib学习

    figure axes axis add subplot subplot figure包括axes figure是画板 axes是画板上的子图 figure 使用add subplot pyplot使用的是subplot生成一个figure
  • (理财八)普通必须掌握的理财方式----定投

    理财八 普通必须掌握的理财方式 定投 我们先要了解一种 一直会用到的 打理股权类产品的投资方式一一基金定投 基金定投不是一个产品 是打理账户用的方法 是未来讲到股票基金配置时候 买入频率的方法 这种方法是被验证确实能帮小白理财者挣到钱的方式
  • 计算机网络01之计算机网络分层结构

    计算机网络01 1 计算机网络分层结构 1 下层为上层提供服务 SDU数据单元 为完成用户所要求功能而应传送的数据 PCI协议控制单元 控制协议操作的信息 PDU协议数据单元 对等层次之间传送的数据单位 2 OSI 7层参考模型 OSI 7
  • 微分中值定理定义及几何意义

    微分中值定理定义及几何意义 1 罗尔定理 2 拉格朗日中值定理 3柯西中值定理 1 罗尔定理 如果函数f x 满足 1 在闭区间 a b 上连续 2 在开区间 a b 内可导 3 f a f b 则在 a b 内至少有一点 a b 使得f
  • QT信号和槽

    系列文章目录 提示 这里可以添加系列文章的所有文章的目录 目录需要自己手动添加 例如 第一章 Python 机器学习入门之pandas的使用 提示 写完文章后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 系列文章目录 前言 一
  • Node.js后端开发 - 基础篇 #2 全局对象

    文章目录 一 前言 二 全局对象 1 console打印输出 2 setTimeout超时输出 3 setInterval循环间隔输出 4 clearInterval 清除循环间隔输出 5 dirname输出当前所在目录 6 filenam
  • 周志华 机器学习 Day26

    学习与推断 基于概率图模型定义的联合概率分布 我们能对目标变量的边际分布或以某些可观测变量为条件的条件分布进行推断 边际分布是指对无关变量求和或积分后得到的结果 例如在马尔可夫网中 变量的联合分布呗表示成极大团的势函数乘积 于是 给定参数
  • 华为OD机试 - 不含101的数(Java)

    题目描述 小明在学习二进制时 发现了一类不含 101的数 也就是 将数字用二进制表示 不能出现 101 现在给定一个整数区间 l r 请问这个区间包含了多少个不含 101 的数 输入描述 输入的唯一一行包含两个正整数 l r 1 l r 1
  • NodeMcu arduino ESP8266 使用WIFIManager 库

    WiFiManager库使用说明 提示 这里可以添加系列文章的所有文章的目录 目录需要自己手动添加 例如 第一章 Python 机器学习入门之pandas的使用 提示 写完文章后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 W
  • matlab作出马鞍面,[2018年最新整理]实验一马鞍面绘制实验.ppt

    2018年最新整理 实验一马鞍面绘制实验 10 实验一 马鞍面绘图实验 实验目的和实验内容 实验原理 实验相关的思考问题 熟悉几个函数 mesh contour linspace figure 显示图形框 mesh X Y Z Meshz
  • 项目上线后遇到的问题总结

    项目上线了 一堆堆的问题也随之出现了 除了时间比较匆忙导致没有细致的做验证之外 当初也确实没有在最重要的功能需求上把好关 导致后来要做很多的修改而弥补之前的错误 下面是上线后遇到的问题和解决办法总结 问题一 用户非正常流程导致的错误 用户注
  • 【读书笔记->统计学】07-03 离散型概率分布-泊松分布概念简介

    泊松分布 假设一个情境 下星期电影院有一个大型促销 影院经理希望一切都完美无缺 爆米花机每一周的平均故障次数为3 4 或者说爆米花机的故障率为3 4 求爆米花机下一周不发生故障的概率有多大 如果预计故障太多次 就打算买个新的爆米花机了 与前