双重差分法,英文名Differences-in-Differences,简称DID,又名倍差法,连玉君老师也称为倍分法。作为政策评估的利器,DID近几年就是学术界的明星,大家去翻国内外TOP期刊,基本上每期都会有DID的paper。现在用个OLS、FE似乎根本就就拿不出手了,因为方法太简单可能会与期刊的“气质”不符,而DID听起来就很高端(虽然就是个交互项),能够满足作者和编辑们的虚荣心。
之前也有不少朋友问我DID的问题,我觉得有必要推送几期有关DID的内容。只要有一个政策外生冲击使得我们的被解释变量y在两个维度发生变化,其实就可以考虑DID。当然,这两个维度一般都是时间维度和地区维度,所以DID常见于面板数据。之前也给大家推送过截面数据构造DID的例子,详见“截面DID的玩法:大饥荒影响了人们的储蓄行为吗?”一文。
这次,我就先举一个政策实施时点一致的DID例子来方便大家理解。2012年,我国开始设立智慧城市试点,首次设立的智慧城市包含90个地、县级城市。石大千等(2018)将智慧城市试点政策看作一次准自然实验,设定了类似如下的DID模型,评估了智慧城市的环境绩效:
其中,treat_i是政策分组变量,智慧城市试点城市就是处理组,非试点城市就是控制组;period_t是政策时间变量,2012年及以后定义为1,之前定义为0。通过政策分组和政策时间两个维度,我们可以将样本划分为4组:政策实施前的处理组、政策实施前的控制组、政策实施后的处理组和政策实施后的控制组。
其中,交互项的系数β_3表示的就是我们所关心的政策效应,它衡量了政策实施前后、处理组和控制组之间的差别。大家在看DID的相关文献时,可能会发现学者们使用的更多的是下面这个模型,模型中只有交互项treat_i×period_t,而没有政策分组变量treat_i和政策时间变量period_t:
其实,换汤不换药,两个模型的内核是一致的,只是下面的模型与FE模型结合在一起,更适合于面板数据的政策评估。其中,λ_i为个体固定效应,更为精确地反映了个体特征,替代了原来粗糙的政策分组变量treat_i;v_t为时间固定效应,更为精确地反映了时间特征,替代了原来粗糙的政策时间变量period_t。
参考资料
石大千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国工业经济,2018(06):117-135.