因果推理(九):双重差分(Difference-in-Differences)

2023-11-06

1. 预备知识

回顾一下第二章的 unconfoundedness 假设:
在这里插入图片描述
无混杂假设等价于 T T T Y Y Y之间没有畅通无阻的后门路径。在这种情况下,关联就是因果,那么可以用下面的式子计算ATE:

E [ Y ( 1 ) − Y ( 0 ) ] = E [ Y ( 1 ) ] − E [ Y ( 0 ) ] = E [ Y ( 1 ) ∣ T = 1 ] − E [ Y ( 0 ) ∣ T = 0 ] = E [ Y ∣ T = 1 ] − E [ Y ∣ T = 0 ] \begin{aligned} \mathbb{E}[Y(1)-Y(0)] &=\mathbb{E}[Y(1)]-\mathbb{E}[Y(0)] \\ &=\mathbb{E}[Y(1) \mid T=1]-\mathbb{E}[Y(0) \mid T=0] \\ &=\mathbb{E}[Y \mid T=1]-\mathbb{E}[Y \mid T=0] \end{aligned} E[Y(1)Y(0)]=E[Y(1)]E[Y(0)]=E[Y(1)T=1]E[Y(0)T=0]=E[YT=1]E[YT=0]

但是在有些时候,我们感兴趣的不是全部样本的ATE而是干预组的ATE。控制组的ATE被称为average treatment effect on the treated (ATT): E [ Y ( 1 ) − Y ( 0 ) ∣ T = 1 ] \mathbb{E}[Y(1)-Y(0) \mid T=1] E[Y(1)Y(0)T=1]。要计算ATT,我们并不需要上述的无混杂假设,而只需一个更弱的假设:
在这里插入图片描述
只需 Y ( 0 ) Y(0) Y(0)是无混杂的就可以,无需假设 Y ( 1 ) Y(1) Y(1)是无混杂的。证明:
在这里插入图片描述

2. 时间维度

通常,我们会有干预组( T = 1 T=1 T=1)和控制组( T = 0 T=0 T=0)。现在我们加入时间维度,并且仅在特定时间后给干预组以干预。用 τ = 1 \tau=1 τ=1代表干预组还未受到干预的时间, τ = 0 \tau=0 τ=0表示干预组受到干预之后的时间。 τ \tau τ时刻在干预 t t t下的潜在结果记为 Y τ ( t ) Y_{\tau}(t) Yτ(t),那么我们想要求的ATT就是: E [ Y 1 ( 1 ) − Y 1 ( 0 ) ∣ T = 1 ] \mathbb{E}\left[Y_{1}(1)-Y_{1}(0) \mid T=1\right] E[Y1(1)Y1(0)T=1]换句话说,我们感兴趣的是受到了干预的干预组的因果效应。
在这里插入图片描述

3. ATT识别

3.1 假设

在这里插入图片描述
这个Consisitency假设告诉我们因果量 E [ Y τ ( 1 ) ∣ T = 1 ] \mathbb{E}\left[Y_{\tau}(1) \mid T=1\right] E[Yτ(1)T=1]等于统计量 E [ Y τ ∣ T = 1 ] \mathbb{E}\left[Y_{\tau} \mid T=1\right] E[YτT=1]。同样的,因果量 E [ Y τ ( 0 ) ∣ T = 0 ] \mathbb{E}\left[Y_{\tau}(0) \mid T=0\right] E[Yτ(0)T=0]等于统计量 E [ Y τ ∣ T = 0 ] \mathbb{E}\left[Y_{\tau} \mid T=0\right] E[YτT=0]。相反, E [ Y τ ( 1 ) ∣ T = 0 ] \mathbb{E}\left[Y_{\tau}(1) \mid T=0\right] E[Yτ(1)T=0] E [ Y τ ( 0 ) ∣ T = 1 ] \mathbb{E}\left[Y_{\tau}(0) \mid T=1\right] E[Yτ(0)T=1]是无法直接识别的反事实因果量。

下面要定义的假设是双重差分的平行趋势(parallel trends)的假设。它是说在干预组在没有被实施干预的时候,干预组的时间趋势和控制组的时间趋势匹配。:
在这里插入图片描述
上述假设等同于差分无混杂:在这里插入图片描述
常规无混杂为:
在这里插入图片描述
然后介绍最后一个假设。这个假设是说治疗在给药前对治疗组没有影响。例如不会出现干预组的人在还没有得到治疗的时候就因为期盼着治疗而病情好转的情况。
在这里插入图片描述

3.2 结果及证明

使用上一节中的假设,我们可以证明ATT等于每个组中不同时间之间的差异的差异,如下图。
在这里插入图片描述
在这里插入图片描述
证明:
在这里插入图片描述

4. 主要问题

用双重差分模型进行因果识别的主要问题是通常情况下平行趋势假设并不能满足。我们可以尝试通过控制相关混杂因素来解决此问题,并尝试满足受控的并行趋势假设:
在这里插入图片描述
这通常是在实践中完成的,但仍可能无法满足平行趋势假设的这一较弱版本。 例如,如果 Y Y Y的结构方程中的干预 T T T和时间 τ \tau τ之间存在相互作用项,我们将永远不会有平行的趋势。

此外,平行趋势假设是scale-specific的。例如,如果我们满足平行趋势,这并不意味着我们在 Y Y Y的某种变换下满足平行趋势。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

因果推理(九):双重差分(Difference-in-Differences) 的相关文章

  • Kubernetes学习笔记之Deployment篇(六)

    Deployment概念 Kubernetes Deployment是Kubernetes中的一个控制器对象 用于管理应用程序的部署 它管理和自动更新应用程序的ReplicaSets 并确保应用程序在任何时候都有一定数量的可用实例 Depl
  • IP3 三阶交调截取点测试(转帖)

    放大器 混频器和振荡器的通用规范 本文介绍并定义了在混频器 放大器和振荡器的数据资料中用到的RF术语 包括增益 变频增益 相位噪声 三阶截取点 P1dB 插入损耗 输出功率 调谐增益和调谐范围 另外还给出了图形和图像以阐明关键的概念 这些在
  • Grouped Query Attention论文阅读

    论文 GQA Training Generalized Multi Query Transformer Models from Multi Head Checkpoints 1 背景介绍 Google在2023年发表的一篇关于Transfo
  • MATLAB求解矩阵特征值的六种方法

    MATLAB求解矩阵特征值的六种方法 关于这个特征值的求解一共六种方法 幂法 反幂法 QR方法 对称QR方法 jacobi方法 二分法 接下来就着重讲解这些算法的是如何使用的 幂法 算法如下 输入 矩阵A 非零矢量x0 maxit 2000
  • openGL之API学习(二十七)glEnable

    开启服务器端的opengl功能 void glEnable GLenum cap GL BLEND If enabled blend the computed fragment color values with the values in
  • LeetCode416-分割等和子集(经典01背包问题—动态规划)

    目录 思路 什么是01背包问题 01背包问题空间复杂度优化 滚动数组 本题代码 本题空间复杂度优化 滚动数组 给你一个 只包含正整数 的 非空 数组 nums 请你判断是否可以将这个数组分割成两个子集 使得两个子集的元素和相等 示例 1 输
  • RPC 设计与实现

    RPC 设计与实现 互联网架构演变 微观 单一架构 以实现功能为目的 扩展性差 数据访问层问题 垂直架构 业务拆分 各司其职 控制层 M V解耦 分布式服务 服务间的相互调度 RPCremote process call 流动式计算 伸缩性
  • 如何判断用户有没有关注订阅号

    收集整理的方法如下 微信用户访问微信公众号 订阅号 的网页时判断用户有没有关注公众号 订阅号 1 前提 微信公众号分为服务号和订阅号 它们的接口权限各不相同 服务号可以通过网页授权接口 用户授权后获取用户的openid 通过用户的openi
  • 如何解决过拟合与欠拟合

    如何解决过拟合与欠拟合 根据不同的坐标方式 欠拟合与过拟合图解不同 1 横轴为训练样本数量 纵轴为误差 如上图所示 我们可以直观看出欠拟合和过拟合的区别 模型欠拟合 在训练集以及测试集上同时具有较高的误差 此时模型的偏差较大 模型过拟合 在
  • GLSL 数据精度

    1 默认精度 顶点着色器中默认精度 precision highp float precision highp int precision lowp sampler2D precision lowp samplerCube 像素着色器中默认
  • 【待完善另一种情况】tensorflow 使用CPU而不使用GPU的问题解决

    文章目录 1 问题 2 Solution 3 other 4 更新 5 参考 1 问题 今天运行代码时发现一个怪现象 在使用TensorFlow时 通过os environ CUDA VISIBLE DEVICES 0 指定使用GPU 0
  • TLB的作用与机制

    TLB Translation Lookaside Buffer 转换检测缓冲区 是用来帮助CPU中的MMU进行地址转换的 在可分页系统中 每个进程都有自己虚拟地址空间和虚拟页面 当CPU执行进程代码读到虚拟地址时 不是直接将该虚拟地址送到

随机推荐

  • 泰勒图(Taylor diagram)绘制方法大汇总

    泰勒图 Taylor diagram 的基本介绍 R 绘制泰勒图 Taylor diagram Python 绘制泰勒图 Taylor diagram 泰勒图 Taylor diagram 的基本介绍 泰勒图 Taylor diagram
  • GEO2R数据下载速度慢、基因注释、差异分析、火山图、热图及后续处理

    GEO2R数据分析 首先感谢生信技能树大神jmzeng1314提供的github包 由于我这边访问github比较困难 因此我已经导入到我的 gitee 托管平台 https gitee com swcyo 特别声明 正版托管地址是http
  • java 工具类实现驼峰和下划线的互相转换

    下划线转驼峰 如果是下划线转驼峰 那么ch就是 public static String toCamel String str String ch if str indexOf ch 1 return str String strings
  • Git下载安装及常用命令

    背景 Git是一个开源的分布式版本控制系统 可以有效 高速的处理从很小到非常大的项目版本管理 安装 在你开始使用 Git 前 需要将它安装在你的计算机上 即便已经安装 最好将它升级到最新的版本 你可以通过软件包或者其它安装程序来安装 或者下
  • shu_1241 邮局位置问题

    http 202 121 199 212 JudgeOnline problem php cid 1078 pid 5 分析 由于题目中的距离是折线距离 所以能够分别考虑两个方向 又x方向与y方向实质是一样的 所以以下 用x方向来分析 如图
  • Linux系统vi命令快捷键汇总

    vi的基本概念 基本上vi可以分为三种状态 分别是命令模式 command mode 插入模式 Insert mode 和底行模式 last line mode 各模式的功能区分如下 命令行模式command mode 控制屏幕光标的移动
  • Linux系统网络启动失败

    nm object get property Error getting State for org freedesktop NetworkManager ActiveConnection Linux系统网络启动失败 出错原因 用图形用户界
  • Java期末作业-社区医疗信息管理系统(源码+数据库文件+设计报告·附下载链接)

    Java期末大作业 社区医疗信息管理系统介绍 比较简单 点我下载项目源码 数据库文件 设计报告文档 介绍 这个小项目没有用到任何框架也没有用到Javaweb的技术 知识使用了Java写代码 使用MySQL创建数据库 然后用JDBC进行连接
  • 什么是信道编码?信道编码比较

    消除干扰 让无线信号更干净 这本是信道编码技术的初衷 然而 最近网络上这场 Polar码投票 闹剧 无中生有地添加杂质 与所议论的技术之本质背道而驰 若Polar码也有血肉之躯 此君情何以堪 香农前辈若在世 也会笑话我们吧 2016年11月
  • 1.NoSQL数据库简介

    1 1技术发展 技术的分类 1 解决功能性的问题 Java Jsp RDBMS Tomcat HTML Linux JDBC SVN 2 解决扩展性的问题 Struts Spring SpringMVC Hibernate Mybatis
  • 服务器的作用

    服务器的作用 1 服务器就好像是一个电话总台一样 而其他的网络设备就像是公共电话 所有的数据传输都要经过服务器的处理 2 服务器作为一个网络节点 为用户提供数据处理服务 最常见的就是使用服务器为自己搭建一个网站 3 服务器运算能力强 可以长
  • Babel安装步骤(JavaScript编译器)

    首先需要安装node js按照官网 下一步 就行 1 npm init 初始化 2 安装依赖包 npm install save dev babel core babel cli 如果说提示babel不是命令 可以全局安装npm insta
  • 05-windows下SQL Developer连接Orcale

    1 使用orcale安装时候自带的工具SQL Developer 工具位置 连接 连接成功
  • 【React 进阶】props 和 state 的区别详解

    时隔一年半之久再次重新学习 React 好多都还是原来的样子 这次我要重新开启 React 的大门 希望各位小伙伴可以一起讨论学习呦 前言 今天我们开始第一个专题 React 中 关于 props 和 state 当然我们不是对 props
  • 【React】19课 react组件使用redux小案例

    小案例效果入下 我们来看一下文件的目录结构 redux文件内的index js文件代码 const add Num 增加一条数据 const remove Num 删除一条数据 state 数据原先的状态 action 需要来进行改造的内容
  • using namespace std啥意思?命名空间?

    using 是C 中的关键字 命名空间作用域参考 两种形式 using 命名空间名 标识符名 将指定的标识符暴露在当前的作用域内 使得在当前作用域可以直接引用该标识符 using namespace 命名空间名 将指定命名空间内的所有标识符
  • 默纳克调试说明书_默纳克_NICE3000调试说明书(修改版)

    4 2 4 密码设置 为了更有效地进行参数保护 NICE3000电梯一体化控制器提供了密码保护 下面示例将密码改为12345的过程 粗体表示闪烁位 图4 9 密码的设定过程 设置了用户密码 即用户密码FP 00的参数不为0 会先进入用户密码
  • Selenium被检测为爬虫,怎么屏蔽和绕过

    01 Selenium 操作被屏蔽 使用selenium自动化网页时 有一定的概率会被目标网站识别 一旦被检测到 目标网站会拦截该客户端做出的网页操作 比如淘宝和大众点评的登录页 当手工打开浏览器 输入用户名和密码时 是能正常进入首页的 但
  • DNS查询服务器的基本流程

    DNS查询服务器的基本流程 假定域名为m xyz com的主机想知道另一台主机 域名为y abc com 的IP地址 例如 主机m xyz com打算发邮件给y abc com 此时 必须知道主机y abc com的IP地址 主机m xyz
  • 因果推理(九):双重差分(Difference-in-Differences)

    1 预备知识 回顾一下第二章的 unconfoundedness 假设 无混杂假设等价于 T T T到 Y Y Y之间没有畅通无阻的后门路径 在这种情况下 关联就是因果 那么可以用下面的式子计算ATE