因果推理（九）：双重差分（Difference-in-Differences）

2023-11-06

1. 预备知识

回顾一下第二章的 unconfoundedness 假设：
在这里插入图片描述
无混杂假设等价于 T T T到 Y Y Y之间没有畅通无阻的后门路径。在这种情况下，关联就是因果，那么可以用下面的式子计算ATE：

E [ Y ( 1 ) − Y ( 0 ) ] = E [ Y ( 1 ) ] − E [ Y ( 0 ) ] = E [ Y ( 1 ) ∣ T = 1 ] − E [ Y ( 0 ) ∣ T = 0 ] = E [ Y ∣ T = 1 ] − E [ Y ∣ T = 0 ] \begin{aligned} \mathbb{E}[Y(1)-Y(0)] &=\mathbb{E}[Y(1)]-\mathbb{E}[Y(0)] \\ &=\mathbb{E}[Y(1) \mid T=1]-\mathbb{E}[Y(0) \mid T=0] \\ &=\mathbb{E}[Y \mid T=1]-\mathbb{E}[Y \mid T=0] \end{aligned} E[Y(1)−Y(0)]=E[Y(1)]−E[Y(0)]=E[Y(1)∣T=1]−E[Y(0)∣T=0]=E[Y∣T=1]−E[Y∣T=0]

但是在有些时候，我们感兴趣的不是全部样本的ATE而是干预组的ATE。控制组的ATE被称为average treatment effect on the treated (ATT)： E [ Y ( 1 ) − Y ( 0 ) ∣ T = 1 ] \mathbb{E}[Y(1)-Y(0) \mid T=1] E[Y(1)−Y(0)∣T=1]。要计算ATT，我们并不需要上述的无混杂假设，而只需一个更弱的假设：
在这里插入图片描述
只需 Y ( 0 ) Y(0) Y(0)是无混杂的就可以，无需假设 Y ( 1 ) Y(1) Y(1)是无混杂的。证明：
在这里插入图片描述

2. 时间维度

通常，我们会有干预组（ T = 1 T=1 T=1）和控制组（ T = 0 T=0 T=0）。现在我们加入时间维度，并且仅在特定时间后给干预组以干预。用 τ = 1 \tau=1 τ=1代表干预组还未受到干预的时间， τ = 0 \tau=0 τ=0表示干预组受到干预之后的时间。 τ \tau τ时刻在干预 t t t下的潜在结果记为 Y τ ( t ) Y_{\tau}(t) Yτ(t)，那么我们想要求的ATT就是: E [ Y 1 ( 1 ) − Y 1 ( 0 ) ∣ T = 1 ] \mathbb{E}\left[Y_{1}(1)-Y_{1}(0) \mid T=1\right] E[Y1(1)−Y1(0)∣T=1]换句话说，我们感兴趣的是受到了干预的干预组的因果效应。
在这里插入图片描述

3. ATT识别

3.1 假设

在这里插入图片描述
这个Consisitency假设告诉我们因果量 E [ Y τ ( 1 ) ∣ T = 1 ] \mathbb{E}\left[Y_{\tau}(1) \mid T=1\right] E[Yτ(1)∣T=1]等于统计量 E [ Y τ ∣ T = 1 ] \mathbb{E}\left[Y_{\tau} \mid T=1\right] E[Yτ∣T=1]。同样的，因果量 E [ Y τ ( 0 ) ∣ T = 0 ] \mathbb{E}\left[Y_{\tau}(0) \mid T=0\right] E[Yτ(0)∣T=0]等于统计量 E [ Y τ ∣ T = 0 ] \mathbb{E}\left[Y_{\tau} \mid T=0\right] E[Yτ∣T=0]。相反， E [ Y τ ( 1 ) ∣ T = 0 ] \mathbb{E}\left[Y_{\tau}(1) \mid T=0\right] E[Yτ(1)∣T=0]和 E [ Y τ ( 0 ) ∣ T = 1 ] \mathbb{E}\left[Y_{\tau}(0) \mid T=1\right] E[Yτ(0)∣T=1]是无法直接识别的反事实因果量。

下面要定义的假设是双重差分的平行趋势（parallel trends）的假设。它是说在干预组在没有被实施干预的时候，干预组的时间趋势和控制组的时间趋势匹配。：
在这里插入图片描述
上述假设等同于差分无混杂：
常规无混杂为：

然后介绍最后一个假设。这个假设是说治疗在给药前对治疗组没有影响。例如不会出现干预组的人在还没有得到治疗的时候就因为期盼着治疗而病情好转的情况。
在这里插入图片描述

3.2 结果及证明

使用上一节中的假设，我们可以证明ATT等于每个组中不同时间之间的差异的差异，如下图。
在这里插入图片描述

证明：

4. 主要问题

用双重差分模型进行因果识别的主要问题是通常情况下平行趋势假设并不能满足。我们可以尝试通过控制相关混杂因素来解决此问题，并尝试满足受控的并行趋势假设：
在这里插入图片描述
这通常是在实践中完成的，但仍可能无法满足平行趋势假设的这一较弱版本。例如，如果 Y Y Y的结构方程中的干预 T T T和时间 τ \tau τ之间存在相互作用项，我们将永远不会有平行的趋势。

此外，平行趋势假设是scale-specific的。例如，如果我们满足平行趋势，这并不意味着我们在 Y Y Y的某种变换下满足平行趋势。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

因果推理