因果系列文章(4)——拨开混杂的迷雾

2023-10-30

本节沿袭上一节的内容,继续学习混杂、阻断、前门/后门路径等概念。

混杂

抽烟的人容易导致肺癌,抽烟的人也容易出现黄手指。因为抽烟这个“共因”,“黄手指”和“肺癌”产生了关联,我们不难发现,手指黄的人很多都容易患肺癌。但是我们不能说,黄手指会导致肺癌,它俩并没有因果关系。这个“共因”也被称之为“混杂因子”(confounder)。在这个例子中,“抽烟”就是“黄手指”和“肺癌”的混杂因子,它让“黄手指”和“肺癌”出现了一种“伪相关”,这种伪相关也被称为“偏倚”(bias)。

图1:“抽烟”作为“黄手指”和“肺癌”的混杂因子

在本专题第一篇文章中介绍的巧克力与诺贝尔奖的例子,也是因为出现了混杂因子,因为某些共因,让巧克力销量和诺贝尔奖产生了关联,但巧克力销量不是导致诺贝尔奖的原因。

更复杂一些、也更常见一些的情形,是混杂因子造成的伪相关关系,和真正的因果效应关系,混合在一起,这便是“混杂”(confounding)的情形。

图2给出了一种最基本的混杂情形。真正的因果效应 A→Y 和叉接合 A←L→Y 诱导的 A 和 Y 之间的伪相关混合在一起。以新冠病毒与死亡率之间的关系为例,感染新冠病毒无疑会大大提高死亡率。但是这样的因果关系中,非常可能存在混杂因子。比如年龄:年轻的人免疫力更好,因此感染新冠病毒的几率也相对较低,死亡率也相对较低;年纪大的人抵抗力差,感染风险高,同时年纪大的人死亡率本身就高。因此“年龄”成为了“感染新冠病毒”与“死亡率”之间关系的混杂因子。所以我们要弄清新冠病毒到底与死亡率的高低具有怎样的关系,我们必须考虑并排除混杂的影响,换句话说,因果推理的一大目标就是尽量消除混杂带来的偏倚(也就是那些非因果的关联关系),找出真正的因果关系。

图2:混杂的基本形式


为了引入分析混杂的方法,首先我们一起学习阻断和d-分离的概念。

阻断与条件独立

回顾上一节最后学习的三种接合类型:链接合、叉接合、对撞接合。我们已经得到了这样的结论:

  • 对于链式和叉式接合,节点 A 和 C 是相关的,链式接合是因为信息从 A 流到了 C ,叉式接合中 A 和 C 本没有相关性,而是因为有了 B 这个混杂因子而让 A 和 C 有了相关性;
  • 对于对撞接合,节点 A 和 C 是相互独立的

图3:三种接合类型

在本节中,我们继续延伸有关相关性的分析。我们可以通过“以某个变量为条件”的方式得出其它节点之间的条件独立性。具体来说:

  • 对于链式接合和叉式接合,通过“以中间变量 B 为条件”(conditioning on variable B ),也即给定 B 的值,比如指定 B=1 或者指定 B=0 ,那么 A 和 C 之间路径被阻断(blocking)。
  • 对于对撞接合,通过“以中间变量 B 为条件”,A 和 C 之间原本被阻断的路径反而被打开,即A 和 C 之间产生了相关性。

这里所说的“以某个变量为条件”的意思,就是指定某个变量的值。比如“以年龄这个变量为条件”(conditioning on age),意思就是说我们只看“年龄=1”或者只看“年龄=0”的那些数据。

下面以具体的例子来解释以上两个结论。首先,对于链式接合,我们假设感染新冠病毒会造成肺部发炎,而肺炎会进一步导致发烧或干咳等临床症状。这个过程可以用如下的链式接合表示:

图3:感染新冠病毒引发肺炎并进一步引发临床症状的链式接合

此时,“感染新冠病毒”和“临床症状”是(边缘)相关的&

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

因果系列文章(4)——拨开混杂的迷雾 的相关文章

随机推荐

  • python基础总结:1.9、错误和异常

    python基础总结 1 9 错误和异常 文章目录 python基础总结 1 9 错误和异常 1 语法错误 2 异常 3 处理异常 4 抛出异常 5 用户自定义异常 6 定义清理操作 7 预定义的清理操作 到目前为止 我们还没有提到错误消息
  • zabbix3.4.2使用discovery对磁盘IO进行监控

    https blog csdn net m0 37814112 article details 80997967
  • c++ 代码

    js 调用c 代码给的接口 c 代码储存在exe和dll文件中 转载于 https www cnblogs com guomengkai p 11502475 html
  • 74HC595芯片——单芯片控制代码示例

    1 关于74HC595 芯片示意图 TSSOP封装 引脚说明 符号 引脚 描述 Q0 Q7 第15脚 第1 7脚 8位并行数据输出 GND 第8脚 地 Q7 第9脚 串行数据输出 MR 第10脚 主复位 低电平有效
  • Sklearn工具包及模型评估

    一 Sklearn工具包介绍 scikit learn 又写作sklearn 是一个开源的基于python语言的机器学习工具包 它通过NumPy SciPy和Matplotlib等python数值计算的库实现高效的算法应用 并且涵盖了几乎所
  • vcs覆盖率选项

    vcs中常用的收集覆盖率选项如下 1 cm dir
  • 【RuoYi-Vue-Plus】学习笔记 05 - 日志框架 TLog

    文章目录 参考资料 一 概述 二 相关配置 1 Maven 2 Logback框架适配器 3 自动打印调用参数和时间 4 TLogConfig 参考资料 1 TLog官方文档 2 TLog官方文档 按需依赖 3 TLog官方文档 Logba
  • kaggle免费GPU,google人机认证

    45条消息 GOOGLE 人机验证 RECAPTCHA 无法显示解决方案 转 散着步的码农的博客 CSDN博客x 许多小伙伴想找免费GPU kaggle确实是个非常不错的选择 本人亲测 配合抖音明日科技还是什么博主和这个博客 可以轻松解决
  • 【IT之路】Docker拉取镜像查看版本

    Docker拉取镜像查看版本 需要在docker hub查看 地址如下 https hub docker com 进入之后 在页面左上角搜索框搜索 以CentOS为例
  • 【测试详解】关于java定时器的常见问题,例如无法取消,被延期执行等

    定时器Timer Timer timer new Timer true 将定时器设置为守护线程 daemon 即当用户线程都已经执行完毕退出以后 jvm就会结束守护进程 不管守护进程是否还有任务 程序退出 定时器任务TimerTask 可以
  • C语言的原子操作

    gcc支持如下原子操作 if GCC VERSION gt 40100 内存访问栅 define barrier sync synchronize 原子获取 define AO GET ptr typeof ptr volatile val
  • 一篇文章告诉你:如何参加成都IT培训拿高薪?

    转行IT开发 这是很多人在工作迷茫时的想法 很多小伙伴被程序员的高薪所以吸引 盲目的学习计算机编程 结果大多都半途而废 甚至开始怀疑自己的智商 造成这种原因主要是盲目跟风 没有制定可行的计算机编程学习计划和学习目标 零基础如何学习IT编程
  • C#使用AutoFac实现IOC依赖注入

    1 配置web cofig配置文件修改执行javascript
  • 安装homeblew与python3替换_Allione_新浪博客

    1 Homebrew是一款Mac OS平台下的软件包管理工具 拥有安装 卸载 更新 查看 搜索等很多实用的功能 简单的一条指令 就可以实现包管理 而不用你关心各种依赖和文件路径的情况 十分方便快捷 使用 Homebrew 安装 Apple
  • JS数组方法

    1 at 方法接收一个整数值并返回该索引的项目 允许正数和负数 负整数从数组中的最后一个项目开始倒数 1 js的数组不存在数组越界 访问越界直接返回 undefined 2 可以填写负数值 入参 string int 整数 负数 返回值 数
  • 计算机配置 凭据分配,win7怎样添加凭据?-win7添加凭证的方法 - 河东软件园

    最近有用户向小编反映 称在使用远程访问桌面时 系统提示 您的凭据不工作 并且在启用 允许分配保存的凭据用于仅 NTLM服务器身份验证 策略后依旧不管用 其实之前小编也分享过如何解决系统提示 您的凭据不工作 的问题 但是该用户发现依然无法解决
  • Prometheus浅析

    1 Prometheus是什么 Prometheus 下文称Prom 是由 SoundCloud 开源监控告警解决方案 与Kubernetes同属CNCF 它已经成为炙手可热的Kubernetes生态圈中的核心监控系统 越来越多的项目 如K
  • STM32标准库函数之 TIM1定时器产生PWM波

    函数功能 定时器1通道1 4产生PWM波 函数参数 无 函数返回值 无 函数描述 无 void Dingshiqi1 PWM Init void TIM TimeBaseInitTypeDef TIM TimeBaseInitStruct
  • 快速解决Android编译报错 : Manifest merger failed with multiple errors, see logs

    编译项目的时候 遇到Android Manifest合并失败的情况就挺头疼的 Manifest merger failed with multiple errors see logs 直接运行项目 看不出来问题 以前都是通过 gradlew
  • 因果系列文章(4)——拨开混杂的迷雾

    本节沿袭上一节的内容 继续学习混杂 阻断 前门 后门路径等概念 混杂 抽烟的人容易导致肺癌 抽烟的人也容易出现黄手指 因为抽烟这个 共因 黄手指 和 肺癌 产生了关联 我们不难发现 手指黄的人很多都容易患肺癌 但是我们不能说 黄手指会导致肺