E
(
x
ˉ
)
=
E
(
1
n
∑
i
=
1
n
X
i
)
=
1
n
∑
i
=
1
n
E
(
X
i
)
=
μ
E(\bar{x})=E(\frac{1}{n} \sum_{i=1}^{n}X_i)=\frac{1}{n}\sum_{i=1}^{n}E(X_i)=\mu
E(xˉ)=E(n1∑i=1nXi)=n1∑i=1nE(Xi)=μ
D
(
x
ˉ
)
=
D
(
1
n
∑
i
=
1
n
X
i
)
=
1
n
2
∑
i
=
1
n
D
(
X
i
)
=
σ
2
n
D(\bar{x})=D(\frac{1}{n} \sum_{i=1}^{n}X_i)=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)=\frac{\sigma^2}{n}
D(xˉ)=D(n1∑i=1nXi)=n21∑i=1nD(Xi)=nσ2
3. 两个样本平均值之差的分布
设
X
1
ˉ
\bar{X_1}
X1ˉ是独立地抽自总体
X
1
∼
N
(
μ
1
,
σ
1
2
)
X_1 \sim N(\mu_1,\sigma_1^2)
X1∼N(μ1,σ12)的一个容量为
n
1
n_1
n1的样本的均值,设
X
2
ˉ
\bar{X_2}
X2ˉ是独立地抽自总体
X
2
∼
N
(
μ
2
,
σ
2
2
)
X_2 \sim N(\mu_2,\sigma_2^2)
X2∼N(μ2,σ22)的一个容量为
n
2
n_2
n2的样本的均值,则有:
E
(
X
1
ˉ
−
X
2
ˉ
)
=
E
(
X
1
ˉ
)
−
E
(
X
2
ˉ
)
=
μ
1
−
μ
2
E(\bar{X_1}-\bar{X_2})=E(\bar{X_1})-E(\bar{X_2})=\mu_1-\mu_2
E(X1ˉ−X2ˉ)=E(X1ˉ)−E(X2ˉ)=μ1−μ2
D
(
X
1
ˉ
−
X
2
ˉ
)
=
D
(
X
1
ˉ
)
−
D
(
X
2
ˉ
)
=
σ
1
2
n
1
+
σ
2
2
n
2
D(\bar{X_1}-\bar{X_2})=D(\bar{X_1})-D(\bar{X_2})=\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}
D(X1ˉ−X2ˉ)=D(X1ˉ)−D(X2ˉ)=n1σ12+n2σ22
当样本量足够大时(一般意义上不小于30),
X
1
ˉ
−
X
2
ˉ
\bar{X_1}-\bar{X_2}
X1ˉ−X2ˉ的抽样分布不管总体分布如何,均可用正态分布来近似。
4.两个样本比例之差的分布
二项分布:重复
n
n
n次独立的伯努利试验(非0即1)成立次数的概率分布。设试验成功的概率为
p
p
p,则有:
E
(
X
)
=
n
p
E(X)=np
E(X)=np,
D
(
X
)
=
n
p
(
1
−
p
)
D(X)=np(1-p)
D(X)=np(1−p);当
n
→
∞
n→∞
n→∞时,而
0
<
p
<
1
0<p<1
0<p<1是一个定值时,二项分布近似于正态分布
N
(
n
p
,
n
p
(
1
−
p
)
)
N(np,np(1-p))
N(np,np(1−p))。
如果在样本大小为
n
n
n的样本中具有某一特征的个体数为
X
X
X,则样本比例用
p
^
=
X
n
\hat{p}=\frac{X}{n}
p^=nX表示,我们使用样本比例
p
^
\hat{p}
p^来估计总体比例
π
\pi
π;
由二项分布的理论可知,当
n
n
n充分大时,
p
^
\hat{p}
p^的分布可用正态分布来逼近(成功的次数/样本量)。此时,
p
^
\hat{p}
p^服从均值为
π
\pi
π、方差为
π
(
1
−
π
)
n
\frac{\pi(1-\pi)}{n}
nπ(1−π)的正态分布(由二项分布的均值、方差推导)。
设分别从具有参数为
π
1
\pi_1
π1和
π
2
\pi_2
π2的二项总体中抽取包含
n
1
n_1
n1和
n
2
n_2
n2个独立样本,则两个样本比例的抽样分布为:
p
1
^
−
p
2
^
=
X
1
n
1
−
X
2
n
2
\hat{p_1}-\hat{p_2}=\frac{X_1}{n_1}-\frac{X_2}{n_2}
p1^−p2^=n1X1−n2X2,且有
E
(
p
1
^
−
p
2
^
)
=
π
1
−
π
2
E(\hat{p_1}-\hat{p_2})=\pi_1-\pi_2
E(p1^−p2^)=π1−π2,
D
(
p
1
^
−
p
2
^
)
=
π
1
(
1
−
π
1
)
n
1
+
π
2
(
1
−
π
2
)
n
2
D(\hat{p_1}-\hat{p_2})=\frac{\pi_1(1-\pi_1)}{n_1}+\frac{\pi_2(1-\pi_2)}{n_2}
D(p1^−p2^)=n1π1(1−π1)+n2π2(1−π2);当
n
1
n_1
n1、
n
2
n_2
n2充分大时,
p
1
^
−
p
2
^
\hat{p_1}-\hat{p_2}
p1^−p2^的抽样分布近似为正态分布。
(
p
1
−
p
2
)
±
Z
α
/
2
p
1
(
1
−
p
1
)
n
1
+
p
2
(
1
−
p
2
)
n
2
(p_1-p_2)\pm Z_{\alpha/2}\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}
(p1−p2)±Zα/2n1p1(1−p1)+n2p2(1−p2)
8.样本量的确认
估计总体均值时样本量的确定
总体均值的置信区间是由样本均值和估计误差两部分组成。在重复抽样或无限总体的抽样条件下,估计误差为
z
α
/
2
σ
n
{z_{\alpha/2}}\frac{\sigma}{\sqrt{n}}
zα/2nσ。由公式可知,一旦确定了置信水平
1
−
α
1-\alpha
1−α,
z
α
/
2
{z_{\alpha/2}}
zα/2的值就确定了。对于给定的
z
α
/
2
{z_{\alpha/2}}
zα/2的值和总体标准差
σ
\sigma
σ,就可以确认任一希望的估计误差所需要的样本量,即有
n
=
(
z
α
/
2
)
2
σ
2
E
2
n=\frac{({z_{\alpha/2}})^2{\sigma^2}}{E^2}
n=E2(zα/2)2σ2,其中,总体标准差
σ
\sigma
σ通常情况下是未知的,可以通过历史数据求得、或通过一批临时样本求得。
估计总体比例时样本量的确定
类似得,估计总体比例置信区间得估计误差为
Z
α
/
2
π
(
1
−
π
)
n
Z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}
Zα/2nπ(1−π),即有
n
=
z
α
/
2
π
(
1
−
π
)
E
2
n=\frac{{z_{\alpha/2}}{\pi}(1-\pi)} {E^2}
n=E2zα/2π(1−π),估计误差
E
E
E必须是使用者事先确定得,一般情况下小于0.10。同样得,
π
\pi
π通常情况下是未知的,可以通过历史数据求得、或通过一批临时样本求得。
四、实例
试验目标:提高在A页面通往B页面的转化率;
试验假设:增加入口文案的诱导性可增加转化。即由原始版本
a
1
a_1
a1修改为试验版本
a
2
a_2
a2;
确定样本量:
n
=
z
α
/
2
π
(
1
−
π
)
E
2
n=\frac{{z_{\alpha/2}}{\pi}(1-\pi)} {E^2}
n=E2zα/2π(1−π)=
1.96
∗
0.3
∗
0.7
0.0
2
2
\frac{1.96*0.3*0.7}{0.02^2}
0.0221.96∗0.3∗0.7=1029。即,我们在历史转化率为30%的基础上,选取95%的置信水平,要求误差不超过2%。若使试验足够可信,至少应有1029个试验样本。则此组试验,至少需要1029*2=2058个试验样本。
试验
展示数
点击数
转化率
a
1
a_1
a1(对照组)
1500
470
31.33%
a
2
a_2
a2(实验组)
1800
650
36.11%
则构建置信区间为:
(
p
1
−
p
2
)
±
Z
α
/
2
p
1
(
1
−
p
1
)
n
1
+
p
2
(
1
−
p
2
)
n
2
(p_1-p_2)\pm Z_{\alpha/2}\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}
(p1−p2)±Zα/2n1p1(1−p1)+n2p2(1−p2)= 0.0478$ 0.032301=[0.0155,0.0801]