【因果推断与机器学习】带入坑——之辛普森悖论

2023-10-31

@[因果推断与机器学习](Why you might Care )

Simpson’s Paradox

考虑一个纯粹假设的未来,那里有一种被称为COVID-27的新疾病在人类中普遍存在。在这个纯粹假设的未来中,已经开发了两种治疗方法: 治疗A和治疗B。治疗B比治疗A价格更贵,因此当前接受治疗A与治疗B的那些人的划分大致为73%/27%。在一个只关心尽量减少生命损失的国家,你负责选择你的国家将专门使用哪种治疗方法。

你有死于 COVID-27 的人的百分比数据,考虑到他们被分配的治疗,以及他们在决定治疗时的状况。他们的病情是一个二元变量:轻度或重度。在该数据中,接受 A 的人中有 16% 死亡,而接受 B 的人中有 19% 死亡。但是,当我们将病情较轻的人与病情严重的人分开检查时,数字的顺序相反。在轻度亚群中,接受 A 的人中有 15% 死亡,而接受 B 的人中有 10% 死亡。在重症亚群中,接受 A 的人中有 30% 死亡,而接受 B 的人中有 20% 死亡。我们在表 1.1 中描述了这些百分比和相应的计数。

Treatment Mild Severe Total
A 15%
(210/1400)
30%
(30/100)
16%
(2240/1500)
B 10%
(5/50)
20%
(100/500)
19%
(105/550)

表1.1: COVID-27数据中的辛普森悖论百分比表示每组的死亡率。越低越好。括号中的数字是相应的计数。这种明显的悖论源于这样的解释,即在检查整个人群时,治疗A看起来更好,但是在所有亚群中,治疗B看起来更好。

明显的悖论源于这样一个事实,在表 1.1 中,“Total”列可以解释为我们应该更喜欢治疗 A,而“轻度”和“严重”列都可以解释为我们应该更喜欢治疗治疗B.1 事实上,答案是,如果我们知道某人的病情,我们应该给他治疗B,如果我们不知道他的病情,我们应该给他治疗A。开个玩笑……那不任何意义。所以说真的,你应该为你的国家选择什么样的治疗方法?
根据数据的因果结构,治疗A或治疗B可能是正确的答案。换句话说,因果关系对于解决辛普森悖论至关重要。现在,我们只给出什么时候你应该更喜欢治疗A和什么时候你应该更喜欢治疗B的直觉。

(找到辛普森悖论的一个关键因素是人员分配给群体的不均匀性。接受治疗A的1500人中有1400患有轻度疾病,而接受治疗B的550人中有500患有严重疾病。由于病情较轻的人死亡的可能性较小,这意味着接受A治疗的人的总死亡率低于轻度和重度疾病在他们之间平均分配的情况。相反的偏差对于治疗B是正确的。)

情景一
在这里插入图片描述
如果身体健康条件 C 是治疗 T 的原因(图 1.1),治疗 B 在降低死亡率 Y 方面更有效。例如,医生决定对大多数病情较轻的人使用治疗方式A进行治疗。而且他们省去了更贵的治疗方式B对于那些重症患者。因为病情严重会导致一个人更有可能死亡(图 1.1 中的 C->Y)并导致一个人更有可能接受治疗 B(图 1.1 中的 C ->T ),这会导致治疗方式B被更容易的和高死亡率联系起来。换句话说,治疗 B 与较高的死亡率相关,仅仅是因为“身体健康情况”是“治疗方式”和“死亡率”的共同原因。在这里,“身体健康状态”混淆了“治疗方式”和“死亡率”,为了纠正这种混杂因素,我们必须检查具有相同条件的患者之间的 T 和 Y 的关系。这意味着更好的治疗方式是在每个亚群中产生较低死亡率的治疗方法(表 1.1 中的“轻度”和“重度”列):也就是 治疗 B。

在这里插入图片描述

情景2: 如果治疗T的处方是身体健康状态C的原因,治疗A更有效。一个示例场景是,治疗B非常稀缺,需要患者在接受治疗之前在接受治疗前等待很长时间。治疗A不存在这个问题。由于一名新冠肺炎患者的病情随着时间的推移而恶化,治疗B的处方实际上导致病情较轻的患者发展为病情严重的患者,导致更高的死亡率。因此,即使治疗B比治疗A更有效(沿T→γ) ,但是治疗B的治疗方式导致更坏的身体健康条件(沿T的负面影响→C→γ) 总的来说,治疗B的效果较差。注:由于治疗B更昂贵,治疗B以0.27概率开具处方,而治疗A以0.73概率开具处方;重要的是,在这种情况下,治疗处方与病情无关。

总而言之,更有效的处理完全取决于问题的因果结构。在方案1中,其中 C C C T T T 的原因 (图1.1),治疗B更有效。在方案2中,其中 T T T C C C 的原因 (图1.2),治疗A更有效。没有因果关系,辛普森悖论就无法解决。有了因果关系,它根本不是一个悖论。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【因果推断与机器学习】带入坑——之辛普森悖论 的相关文章

随机推荐

  • systemd启动mysql后一直卡住,Systemd Mysql不会停止

    升级到15 04后 我有很多乐趣了解systemd 我想我一切正常 除了我无法阻止mysql service systemctl命令只是挂起而且mysql一直在运行 有没有其他人经历过这个或者可能知道发生了什么 解决方法 我有同样的问题 升
  • 蓝桥杯.剪格子(DFS)

    Question Solve 深搜板子题 分成两部分 两部分的数字和相同 dfs去创造路径 然后比对路径上的数字和与剩余点的数字和 优化点 读入时候先求和sum 路径和ans另算 直接去判断ans是不是sum的一半 ans gt sum 2
  • 理解fasterRCNN模型的构成,并进行训练和预测

    学习目标 了解VOC数据集的应用 理解fasterRCNN模型的构成 能够利用fasterRCNN网络模型进行训练和预测 1 VOC数据集简介 Pascal VOC数据集作为基准数据 在目标检测中常被使用到 很多优秀的计算机视觉模型比如分类
  • 逆向图片搜索 搜索自己想搜索的

    Tineye 是一个用图片搜索图片的技术 http www tineye com 开始时Tineye是邀请注册 后来是开放注册 不过都需要注册才能使用 现在终于完全放开 无需再注册或登录即可使用该搜索引擎 此外 Tineye最近还增添了一下
  • Vue+ElementUI el-radio列表单选

    实现效果 对某条数据进行数据修改 步骤 1 添加单选按钮 点击获取该条信息的id 并将id传给修改按钮 div 1 修改按钮 span size mini 修改信息 span 2 列表单选按钮
  • OptiSystem应用:光放大器EDFA的仿真

    Optisystem可以设计和模拟光纤放大器和光纤激光器 此处展示的案例可在Optisystem安装文件夹samplesOptical amplifiers中找到 该教程将会介绍光放大器库这一部分 光放大器 全局参数 使用Optisyste
  • Linux系统下Java 转换Word到PDF时,结果文档内容乱码的解决方法

    本文分享在Linux系统下 通过Java 程序代码将Word转为PDF文档时 结果文档内容出现乱码该如何解决 具体可参考如下内容 1 问题出现的背景 在Windows系统中 使用Spire Doc for Java将Word文档转换为PDF
  • [深度学习入门]Python基础语法(上)

    目录 一 程序设计基本方法 1 计算机是根据指令操作数据的设备 2 编程设计语言概述 3 计算机编程 4 IPO程序编写方法 5 使用计算机解决问题 二 基础知识 1 pyCharm 为人工智能领域常用的IDE 2 Python的简单使用
  • NVIDIA Shield 消失的解决办法和Moonlight串流

    Foreword 之前有用Moonlight串口pc的游戏到公司电脑 然后突然有一天串流就不可用了 NVIDIA Shield 就消失了 怎么都开不起来 串流就失败了 然后也记录一下Moonlight串流的操作 由于NVIDIA单方面宣布停
  • vue+element 根据状态,显示不同的操作按钮

    效果截图 VUE 核心功能代码片段
  • 【yolov5】yolov5训练自己的数据集全流程----包含本人设计的快速数据处理脚本

    关于yolo应用时能用到的脚本集合 推荐收藏 https chenlinwei blog csdn net article details 127299428 文章目录 1 工程化快速yolo训练流程指定版 无讲解 1 1 抽样数据集 xm
  • Spring MVC中如何进行转发和重定向呢?

    转自 Spring MVC中如何进行转发和重定向呢 重定向 我们将用户的定向到另一个视图 jsp 中处理 此操作是一个客户端行为 类似与url的链接操作 转发 将用户的请求转发到另一个视图或controller处理 此操作是一个服务器端行为
  • 【日常遇坑总结】类成员变量的空间分配和初始化顺序

    遇坑 今天在用QT的时候 传从主ui页面创建的一个指针到建模ui页面 在运行时程序发生奔溃 经过测试发现问题 主页面的指针和传进建模页面的指针不是同一个 导致在调用类指针方法时发生错误 测试 以下代码仅展示测试代码的部分 不可运行 但能从下
  • spring+ jcaptcha(spring框架下的彩色验证码)

    从jcaptcha官方网站下载jcaptcha的发行包 并将其发行包中的jar文件考贝到本地项目WEB INF目录下的lib目录中 官方网址http jcaptcha sourceforge net 在web xml文件中配置 Java代码
  • 嵌入式知识图谱WiKi(嵌入式开发/研发入门教程和路线图)

    嵌入式知识图谱WiKi 作者 将狼才鲸 创建时间 2022 02 18 因图床更新不方便 最新版请跳转到Gitee文档源文件仓库网址 才鲸 嵌入式知识图谱WiKi CSDN有图的文档阅读网址 嵌入式知识图谱WiKi Bilibili视频讲解
  • 数据结构--二叉树

    前言 关于二叉树知识的考察主要分两部分 第一部分在初赛中体现 一般考察二叉树的节点个数 树高和遍历问题 1 二叉树定义 在计算机科学中 二叉树是每个结点最多有两个子树的树结构 通常子树被称作 左子树 left subtree 和 右子树 r
  • Log4j2日志框架

    Log4j2日志框架 1 简介及入门示例 1 背景介绍 官网地址 https logging apache org log4j 2 x Maven 仓库地址 https search maven org artifact org apach
  • 机器学习心得体会总结

    第一 线性代数是把复杂问题简单化解决 但是简单问题已经很复杂了 第二 国内还没有一本关于机器学习讲得连老百姓都能看得明白的书籍 第三 克拉默法则 逆矩阵 初等变换都可以求解方程Ax b 后者方法更简单
  • C语言

    目录 一 实验环境 二 黑白圣诞树 三 windows h简介 四 windows h实现彩色圣诞树 1 设置用户窗口 2 移动光标 3 修改字体颜色 4 绘制圣诞树 5 绘制雪景 6 完整代码 7 运行 一 实验环境 编译环境 vc 6
  • 【因果推断与机器学习】带入坑——之辛普森悖论

    因果推断与机器学习 Why you might Care Simpson s Paradox 考虑一个纯粹假设的未来 那里有一种被称为COVID 27的新疾病在人类中普遍存在 在这个纯粹假设的未来中 已经开发了两种治疗方法 治疗A和治疗B