该篇是本人入门因果+CV的随笔,期间会借鉴记录别人的理解,引用的部分会给出原始连接,如有侵权请联系我删除。
Judea Pearl老爷子的《The Book of Why》因果理论的探索类比成一个向上的阶梯,包含三个层级:Seeing,Doing和Imaging。 当我们在说因果的时候我们在说什么 第一层级:Association 关联对应的是大多数机器学习算法和动物。该层级强调基于被动的观察(passive observation)来预测,通过观察来寻找规律,并非真正的因果。
比如当我们观察到“火焰”和“热”共生了足够多的次数,并且看到热在火焰之后出现,就把火焰当作热的原因。显然,这种定义只涉及因果之梯中第一层级的association。在这个例子中我们得到的因果关系是基本正确的,但是在很多情况下会导致错误。比如社会学家曾发现冰淇淋的销售量 和 犯罪率 有很大的关联,那我们会觉得冰淇淋会导致犯罪嘛?肯定不合理,实际原因是我们忽略了冰淇淋售卖量和犯罪率拥有一个共因:炎热的天气。**也正是因为我们对这种隐藏因素的忽略导致了因果推断的错误,这种因素就被称之为:confounder混杂因子。**
第二层级:Intervention 干预,对应的是人类祖先。其典型问题是“如果我们实施…行动,将会怎样”,干预是比关联更高级别的存在,因为他不仅涉及被动的(passive)观测,还有主动的(active)改变,人们想通过干预消除上文提到的混杂的影响,推导真正的因果关系。
整体上看,干预可以分为两大类:1.随机对照实验(randomized controlled trial, RCT);2.Judea Pearl提出的“do算子”其最大的,神奇之处在于,我们可以使用相应的调整公式从observation data中测算真正的因果效应(即去除confounder的影响)而无需真正的实验。
**第三层级:Counterfactual 反事实,**对应于极具智慧的人类文明,也是因果之梯的顶峰。counterfactual和干预intervention区分的关键在于“hindsight”(事后来看),即反事实强调在对结果已知观测的基础上再对反事实的问题进行解答:“假如当时发生的与实际情况不同,结果会怎样?”,这就要求一种对虚构世界的推理能力。
举个栗子,比如Intervention解决的是“吸烟是否导致肺癌”,而counterfactual研究的是“我的外公30年来每天一支烟,假如他不曾吸烟的话,他会活多久”。
智源社区张含望老师分享
分享链接 现有机器学习方法不可解释,预测不稳定