我们用字母 p 代表总体的成功概率,我们也能方便地用 p 代表比例一二者数值相同。
p
=
p
r
o
b
a
b
i
l
i
t
y
(
概
率
)
=
p
r
o
p
o
r
t
i
o
n
(
比
例
)
p = probability(概率) = proportion(比例)
p=probability(概率)=proportion(比例) 例题:
那么具体计算呢?我们想求
E
(
P
s
)
E(P_s)
E(Ps),其中
P
s
=
X
/
n
P_s=X/n
Ps=X/n。也就是说,我们想求出所期望的样本比例数值,这里的样本比例等于红色糖球的数量除以样本糖球的总数量,即:
E
(
P
s
)
=
E
(
X
n
)
=
E
(
X
)
n
E(P_s) = E(\frac{X}{n}) = \frac{E(X)}{n}
E(Ps)=E(nX)=nE(X) 上式中的X为样本中红色糖球的数目,如果我们把红色糖球数目视为“成功数目”,则X~B(n,p)。X为二项分布,期望为np。则:
E
(
P
s
)
=
E
(
X
n
)
=
E
(
X
)
n
=
n
p
n
=
p
E(P_s) = E(\frac{X}{n}) = \frac{E(X)}{n} = \frac{np}{n} = p
E(Ps)=E(nX)=nE(X)=nnp=p 这个结果正好符合直觉。我们可以期望样本的成功比例与总体的成功比例相一致。
P
s
P_s
Ps的方差
与求期望的方法相似,
V
a
r
(
P
s
)
=
V
a
r
(
X
n
)
=
V
a
r
(
X
)
n
2
Var(P_s) = Var(\frac{X}{n}) = \frac{Var(X)}{n^2}
Var(Ps)=Var(nX)=n2Var(X)
提示:
V
a
r
(
a
x
)
=
a
2
v
a
r
(
x
)
Var(ax) = a^2var(x)
Var(ax)=a2var(x)
由于X为二项分布,方差为npq,则:
V
a
r
(
P
s
)
=
V
a
r
(
X
n
)
=
V
a
r
(
X
)
n
2
=
n
p
q
n
2
=
p
q
n
Var(P_s) = Var(\frac{X}{n}) = \frac{Var(X)}{n^2} = \frac{npq}{n^2} = \frac{pq}{n}
Var(Ps)=Var(nX)=n2Var(X)=n2npq=npq 取方差的平方根,可得
P
s
P_s
Ps的标准差,它指出样本比例与p的可能差距,有时候我们将它称为“比例标准误差”,因为它能指出样本比例的可能误差。
比
例
标
准
误
差
=
p
q
n
比例标准误差 = \sqrt{\frac{pq}{n}}
比例标准误差=npq n越大,比例标准误差越小。也就是说,样本中包含的对象越多,用样本比例作为p的估计量就越可靠。(我理解为样本中含红色糖球的概率为0.25的可能性越大,越接近0.25,n太小了可能就有意外情况多一些,比如2颗中有1颗红色糖球)
求解
P
s
P_s
Ps的分布
我们求出了
P
s
P_s
Ps的期望和方差,为了求出想要的概率,还需要知道它的分布,而
P
s
P_s
Ps的分布又取决于样本的大小。下面是一张
P
s
P_s
Ps的分布图,其中n很大。
P
s
P_s
Ps符合正态分布
当n很大时,
P
s
P_s
Ps的分布接近正态分布。所谓“很大”是指大于30。n越大,
P
s
P_s
Ps的分布越接近正态分布。也就是说,当n很大的时候:
P
s
∼
N
(
p
,
p
q
n
)
P_s \sim N(p,\frac{pq}{n})
Ps∼N(p,npq) 之后我们就可以用正态分布的求法求出“某一大盒糖盒中的红色糖球比例至少为40%”的概率了。
我们前面讲过,如果用 X 表示样本中的成功数目,则
P
s
=
X
/
n
P_s=X/n
Ps=X/n; X 的正态连续性修正为±(1/2)。
如果我们用以上数值替代公式
P
s
=
X
/
n
P_s=X/n
Ps=X/n中的X,那么
P
s
P_s
Ps的连续性修正为:
连
续
性
修
正
=
±
(
1
/
2
)
n
=
±
1
2
n
连续性修正 = \frac{\pm (1/2)}{n} = \frac{\pm 1}{2n}
连续性修正=n±(1/2)=2n±1 即,如果用正态分布近似计算P的概率,一定要用±1/2n进行连续性修正;连续性修正的确切数值取决于数值。(我的理解:实际上是这样
P
s
=
X
±
(
1
/
2
)
n
=
X
n
±
(
1
/
2
)
n
P_s = \frac{X \pm (1/2)}{n} = \frac{X}{n} \pm \frac{(1/2)}{n}
Ps=nX±(1/2)=nX±n(1/2),加号或者减号根据实际情况)