无混杂假设等价于
T
T
T到
Y
Y
Y之间没有畅通无阻的后门路径。在这种情况下,关联就是因果,那么可以用下面的式子计算ATE:
E
[
Y
(
1
)
−
Y
(
0
)
]
=
E
[
Y
(
1
)
]
−
E
[
Y
(
0
)
]
=
E
[
Y
(
1
)
∣
T
=
1
]
−
E
[
Y
(
0
)
∣
T
=
0
]
=
E
[
Y
∣
T
=
1
]
−
E
[
Y
∣
T
=
0
]
\begin{aligned} \mathbb{E}[Y(1)-Y(0)] &=\mathbb{E}[Y(1)]-\mathbb{E}[Y(0)] \\ &=\mathbb{E}[Y(1) \mid T=1]-\mathbb{E}[Y(0) \mid T=0] \\ &=\mathbb{E}[Y \mid T=1]-\mathbb{E}[Y \mid T=0] \end{aligned}
E[Y(1)−Y(0)]=E[Y(1)]−E[Y(0)]=E[Y(1)∣T=1]−E[Y(0)∣T=0]=E[Y∣T=1]−E[Y∣T=0]
但是在有些时候,我们感兴趣的不是全部样本的ATE而是干预组的ATE。控制组的ATE被称为average treatment effect on the treated (ATT):
E
[
Y
(
1
)
−
Y
(
0
)
∣
T
=
1
]
\mathbb{E}[Y(1)-Y(0) \mid T=1]
E[Y(1)−Y(0)∣T=1]。要计算ATT,我们并不需要上述的无混杂假设,而只需一个更弱的假设:
只需
Y
(
0
)
Y(0)
Y(0)是无混杂的就可以,无需假设
Y
(
1
)
Y(1)
Y(1)是无混杂的。证明:
2. 时间维度
通常,我们会有干预组(
T
=
1
T=1
T=1)和控制组(
T
=
0
T=0
T=0)。现在我们加入时间维度,并且仅在特定时间后给干预组以干预。用
τ
=
1
\tau=1
τ=1代表干预组还未受到干预的时间,
τ
=
0
\tau=0
τ=0表示干预组受到干预之后的时间。
τ
\tau
τ时刻在干预
t
t
t下的潜在结果记为
Y
τ
(
t
)
Y_{\tau}(t)
Yτ(t),那么我们想要求的ATT就是:
E
[
Y
1
(
1
)
−
Y
1
(
0
)
∣
T
=
1
]
\mathbb{E}\left[Y_{1}(1)-Y_{1}(0) \mid T=1\right]
E[Y1(1)−Y1(0)∣T=1]换句话说,我们感兴趣的是受到了干预的干预组的因果效应。
3. ATT识别
3.1 假设
这个Consisitency假设告诉我们因果量
E
[
Y
τ
(
1
)
∣
T
=
1
]
\mathbb{E}\left[Y_{\tau}(1) \mid T=1\right]
E[Yτ(1)∣T=1]等于统计量
E
[
Y
τ
∣
T
=
1
]
\mathbb{E}\left[Y_{\tau} \mid T=1\right]
E[Yτ∣T=1]。同样的,因果量
E
[
Y
τ
(
0
)
∣
T
=
0
]
\mathbb{E}\left[Y_{\tau}(0) \mid T=0\right]
E[Yτ(0)∣T=0]等于统计量
E
[
Y
τ
∣
T
=
0
]
\mathbb{E}\left[Y_{\tau} \mid T=0\right]
E[Yτ∣T=0]。相反,
E
[
Y
τ
(
1
)
∣
T
=
0
]
\mathbb{E}\left[Y_{\tau}(1) \mid T=0\right]
E[Yτ(1)∣T=0]和
E
[
Y
τ
(
0
)
∣
T
=
1
]
\mathbb{E}\left[Y_{\tau}(0) \mid T=1\right]
E[Yτ(0)∣T=1]是无法直接识别的反事实因果量。