泊松分布
假设一个情境:下星期电影院有一个大型促销,影院经理希望一切都完美无缺。爆米花机每一周的平均故障次数为3.4,或者说爆米花机的故障率为3.4。
求爆米花机下一周不发生故障的概率有多大?(如果预计故障太多次,就打算买个新的爆米花机了。)
与前面不同,这一次不存在一系列的试验,相反,这一次的情况是这样的:已知故障的发生几率,且该故障是随机发生的。
这一类问题的难点在于,尽管我们知道平均故障次数,但是实际的故障次数却不是固定的。从总体上看,我们可以期望的故障次数是每周3或4次,但在倒霉的某一周,故障会多得多,而在顺利的某一周,故障则根本不会发生。
泊松分布是专门应对这种情况的。
泊松分布的条件
- 单独时间在给定区间内随机、独立地发生,给定区间可以是时间或空间,例如可以是一个星期,也可以是一英里。
- 已知该区间内的事件平均发生次数(或者叫做发生率),且为有限数值。该事件平均发生次数通常用希腊字母
λ
\lambda
λ(lambda)表示。
让我们用X表示给定区间内的事件发生次数,例如一个星期内的损坏次数。如果X符合泊松分布,且每个区间内平均发生λ次,或者说发生率为λ,则写作:
X
∼
P
o
(
λ
)
X \sim Po(\lambda)
X∼Po(λ)
我们就不在这里进行推导了。在求给定区间内发生r次事件的概率时,请使用下式进行计算:
P
(
X
=
r
)
=
e
−
λ
λ
r
r
!
P(X=r) = \frac{e^{-\lambda}\lambda^r}{r!}
P(X=r)=r!e−λλr
e是一个数学常数,一般为2.718,只要把这个数字代入泊松分布公式就行了。
如果X~Po(2),则:
P
(
X
=
3
)
=
e
−
2
∗
2
3
3
!
=
0.180
P(X=3) = \frac{e^{-2} * 2^3}{3!} = 0.180
P(X=3)=3!e−2∗23=0.180
柏松分布的期望和方差
如果X~Po(λ),则E(X)为我们在给定区间内能够期望的事件发生次数,对于爆米花机来说,则为我们在普通的一周内能够期望的机器损坏次数,也就是说,E(X)是给定区间内的事件平均发生次数。
现在,如果X~Po(λ),则事件平均发生次数以λ表示,则E(X)等于λ。同时,方差也是λ。
E
(
X
)
=
λ
V
a
r
(
X
)
=
λ
E(X) = \lambda \\ Var(X) = \lambda
E(X)=λVar(X)=λ
柏松分布的形状
泊松分布的形状随着λ的数值发生变化。λ小,则分布向右偏斜,随着λ变大,分布逐渐变得对称。
如果λ是一个整数,则有两个众数λ和λ-1,如果λ不是整数,则众数为λ。
爆米花机例题:
问:泊松分布的公式是怎么来的?
答:实际上可以从其他公式推导出来,但会涉及很多数学知识。在实际应用中,最好的方法是记住这个公式及其应用条件。
问:泊松分布和其他概率分布有何差别?
答:主要差别是泊松分布不需要做一系列试验,但它描述了事件在特定区间内的发生次数。
组合泊松变量
假设一种情况:现在有爆米花机和饮料机,爆米花机每周发生故障的平均次数是3.4(X~Po(3.4)),饮料机每周发生故障的平均次数是2.3(Y~Po(2.3))。求下一周机器不出故障的概率。
如果X代表爆米花机每周发生故障的次数,Y代表饮料机每周发生故障的次数,则X和Y都符合泊松分布,另外,X和Y是相互独立的,即一方是否发生故障对另一方发生故障的概率没有影响。
我们需要求出下个星期故障总次数为0的概率,即:
P
(
X
+
Y
=
0
)
P(X+Y=0)
P(X+Y=0)
因为X和Y是独立随机变量,则
P
(
X
+
Y
)
=
P
(
X
)
+
P
(
Y
)
E
(
X
+
Y
)
=
E
(
X
)
+
E
(
Y
)
P(X+Y) = P(X) + P(Y) \\ E(X+Y) = E(X) + E(Y)
P(X+Y)=P(X)+P(Y)E(X+Y)=E(X)+E(Y)
即如果X~Po(
λ
x
λ_x
λx)且X~Po(
λ
y
λ_y
λy),则:
X
+
Y
∼
P
o
(
λ
x
+
λ
y
)
X+Y \sim Po(\lambda_x + \lambda_y)
X+Y∼Po(λx+λy)
即,如果X和Y都符合泊松分布,则X+Y也符合泊松分布。也就是说,可以利用X+Y的分布情况求出X+Y的概率。
例题解答:
利用泊松分布近似二项分布
泊松分布还有一个用途:在特定条件下可以用来近似代替二项分布。这样可以方便计算,不用必须计算阶乘了(二项分布的公式中有组合
C
n
r
C_n^r
Cnr,n太大了会不好算)。
什么时候近似?
假设我们有一个变量X,且X~B(n,p),要求有这样一种条件:B(n,p)近似等于Po(λ)。
让我们首先研究两种分布的期望和方差。我们的目标是赵处泊松分布的期望和方差近似等于二项分布的期望和方差的情况,即希望:
当q近似等于1且n很大时,np和npq近似相等。即:
当n很大且p很小时,可以用X~Po(np)近似代替X~B(n,p)。
当n大于50且p小于0.1时,为典型的近似情况。
例题:
泊松分布总结
结束例题:
这道题我就是不理解为什么还多一个P(X=0)?
章节总结