因果学习介绍

2023-11-13

目前数据驱动的方法大多是建立数据和标签之间的关联,但是这种关联可能是有偏见或者错误的,因果学习就是想加入知识,来消除这种偏见。

机器学习是在大量数据的基础上,应用一些数学理论,尽可能建立一个模型,去拟合这些数据的分布情况。这个模型就像是一个函数,当给模型输入了参数之后,就会生成符合上述数据分布的预测结果。

因果机器学习(CausalML)是将数据生成过程形式化为结构因果模型(SCM)的机器学习方法的总称。这使得人们可以对这一过程的变化的影响(即干预)和事后会发生什么(即反事实)进行推理。根据他们所解决的问题,我们将CausalML中的工作分为五组:(1)因果监督学习,(2) 因果生成模型,(3) 因果解释,(4) 因果公平,(5) 因果强化学习。对每一类方法进行了系统的比较,并指出了有待解决的问题。

那么为什么上述机器学习模型容易在数据分布变化时出现决策失误呢? 因为它可能学到了不具备泛化性能的关联性,相对I.I.D.(独立同分布)假设下的模型学习,这种训练环境和测试环境的数据分布不同的问题称为Non-I.I.D.或者OOD(Out-of-Distribution)。模型需要学到做出预测或判断的本质原因和规律,而非依赖于表面“看上去”的关联关系。人们已经发现标准的有监督学习方法,特别是深度学习方法对分布外样例的预测表现欠佳。若训练集中大部分“哈士奇”的图片都是暗背景而大部分“狼”的图片都是雪地背景,那对于处在雪地中的“哈士奇”的测试样例,模型会预测为“狼”。若对模型进行可视化可发现模型更关注于背景,因为在这样的数据集上,背景与前景物体具有很强的关联性,并且背景是一个比前景物体更有区分度的特征,但只有前景物体决定图片的标注。

希望模型能够学到类似于前景物体这样的特征进行预测。此目标可在因果关系理论下进行正式的描述。该理论是通过系统在干预(intervention)下的表现来定义因果关系的,即若通过干预改变变量 A 的值会改变变量 B 的值而干预 B 不会改变 A,那 A 就是 B 的因(cause),B 就是 A 的果(effect),记为 A→B。若强行改变一张图 x 的背景而维持前景物体不变,那这张图的标注 y 不应改变,而改变前景物体却会改变 y。所以研究员们希望模型学到的是标注 y 的因,称为“语义因子”(semantic factor)s,如前景物体,而相区别的是“多变因子”(variation factor)v,如图片背景。只有将 s 识别出来才能做好分布外预测(out-of-distribution prediction)。

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

因果学习介绍 的相关文章

  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 问CHAT很繁琐的问题会不会有答案呢?

    问CHAT 什么已有的基于极值理论的极端温度重现期主要针对极端高温事件 对极端低温事件研究较少 CHAT 回复 为这主要可能是由于以下几个原因 1 气候变化与全球变暖 当前 全球变暖和气候变化的问题备受关注 这导致科研者更加关注极端高温事件
  • socket网络编程几大模型?看看CHAT是如何回复的?

    CHAT回复 网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型 一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求 不需
  • 利用CHAT写实验结论

    问CHAT 通过观察放置在玻璃表面上的单个水滴 人们可以观察到水滴充当成像系统 探究这样一个透镜的放大倍数和分辨率 CHAT回复 实验报告标题 利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率 一 实验目的 通过对比和测量 研究和探索玻
  • 基于java的ssh医院在线挂号系统设计与实现

    基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机 基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机 随着信息技术的迅速发展和应用 医院在线挂号系统已成为医院管理的重要组成部分 传统的挂号方式存在许多
  • 面对AI革新时,Soul App等社交应用的“出圈”解法是什么?

    2023年初 ChatGPT掀开海内外互联网 AI革新 的序幕 公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳 帮助大家提升工作及学习效率之余 更为期待的莫过于有一天人工智能的 意识觉醒 十余年前由斯派克 琼斯 Spike Jon
  • 链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

    近日 权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点 报道指出 波场TRON网络在2023年取得了一系列的发展和合作 提升了其在Web3领域的地位 其中 波场TRON网络账户数量增加了 54
  • 用CHAT分析高校体育智慧教学体系构建与探索研究现状

    CHAT回复 现阶段 高校体育智慧教学体系的构建与探索研究还处于初级阶段 但全球数字化转型大潮的推动下 一些较为前沿的研究和实践已经开始出现 1 教学平台的建设 很多高校已经开始尝试使用在线教育平台进行体育教学 把传统的面对面授课模式转变为
  • 明日 15:00 | NeurIPS 2023 Spotlight 论文

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入 哔哩哔哩直播通道 扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍 黄若孜 腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
  • 作物叶片病害识别系统

    介绍 由于植物疾病的检测在农业领域中起着重要作用 因为植物疾病是相当自然的现象 如果在这个领域不采取适当的护理措施 就会对植物产生严重影响 进而影响相关产品的质量 数量或产量 植物疾病会引起疾病的周期性爆发 导致大规模死亡 这些问题需要在初
  • 手把手教你用 Stable Diffusion 写好提示词

    Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度 文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好 前面文章写了一篇文章 一份保姆级的 Stable Diffusion
  • 做大模型也有1年多了,聊聊这段时间的感悟!

    自ChatGPT问世以来 做大模型也有1年多了 今天给大家分享这一年后的感悟 过去一年应该是AI圈最万千瞩目的一年了 大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注 以至于有一年的时间好像经
  • AI在保护环境、应对气候变化中的作用

    对于AI生命周期数据领域的全球领导者而言 暂时搁置我们惯常的AI见解和AI生命周期数据内容产出 来认识诸如世界地球日这样的自然环境类活动日 似乎是个奇怪的事情 我们想要知道 数据是否真的会影响我们的地球环境 简而言之 是 确实如此 但作为一
  • AI帮助终结全球饥饿问题

    全球饥饿问题是牵动人心的头等大事 5月28日是 世界饥饿日 这一问题更值得关注 让人人都能吃饱的想法不仅令人向往 而且很快就会变成现实 与大多数新事物引进一样 对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用 人们还踟蹰不前
  • 开始弃用NeRF?为什么Gaussian Splatting在自动驾驶场景如此受欢迎?(浙江大学最新)...

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述 文章首先回顾了3D Gaussian的原理和应用 借着全面比较了3D GS在静态
  • 【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
  • 考虑光伏出力利用率的电动汽车充电站能量调度策略研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 为什么我强烈推荐大学生打CTF!

    前言 写这个文章是因为我很多粉丝都是学生 经常有人问 感觉大一第一个学期忙忙碌碌的过去了 啥都会一点 但是自己很难系统的学习到整个知识体系 很迷茫 想知道要如何高效学习 这篇文章我主要就围绕两点 减少那些罗里吧嗦的废话 直接上干货 CTF如
  • Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

    文章目录 摘要 1 问题的提出 引出当前研究的不足与问题 KGC方法 LLM幻觉现象 解决方案 2 数据集和模型构建
  • 对中国手机作恶的谷歌,印度CEO先后向三星和苹果低头求饶

    日前苹果与谷歌宣布合作 发布了 Find My Device Network 的草案 旨在规范蓝牙追踪器的使用 在以往苹果和谷歌的生态形成鲜明的壁垒 各走各路 如今双方竟然达成合作 发生了什么事 首先是谷歌安卓系统的市场份额显著下滑 数年来

随机推荐

  • 树莓派配置热点(即设置wifi)

    https www raspberrypi org documentation configuration wireless access point routed md 如果官网打不开 看次链接 https qinfeng blog cs
  • rollup常用插件盘点

    1 rollup plugin commonjs 将 CommonJS 模块转换为 ES2015 供 Rollup 处理 rollup plugin commonjs是一个用于将CommonJS模块转换为ES6模块的Rollup插件 它的主
  • Vue组件化学习之scoped

    简介 主要介绍scoped的作用 先弄一个案例 main js 引入vue依赖 import Vue from vue 引入组件App import App from App vue 关闭生产提示 Vue config production
  • pip install -r requirements.txt出现错误解决办法

    pip install r requirements txt安装出现以下错误解决办法如下 PS D YOLO yolov5 master gt pip install r requirements txt Collecting matplo
  • 配置IIS之虚拟目录

    什么是IIS虚拟目录 有什么优点 虚拟目录指在站点下建立一个虚拟子目录 指定一个固定的物理路径做为站点的应用路径 1 虚拟目录与父级站点共用一个应用程序池 例如 站点TestWeb c Inetpub wwwroot TestWeb 下建立
  • 安利一个实用项目--物美智能

    安利一个实用项目 可用于二次开发 官网 项目介绍 项目地址 演示地址
  • Windows 下 Redis 安装与配置 教程

    文章目录 一 Windows 下安装 Redis 的几种方式 1 微软官方维护的 Redis 2 tporadowski 维护的 Redis 3 使用 WSL 安装 Redis 4 使用gcc编译器在Windows下编译redis源码 二
  • USB转串口驱动代码分析

    1 USB插入时 创建设备 DriverObject gt DriverExtension gt AddDevice USB2COM PnPAddDevice 步一 调用USB2COM CreateDeviceObject创建功能设备对象
  • C语言中的printf与scanf函数

    1 printf函数的格式字符串 md 左对齐 若m比实际少时 按实际输出 不足右补空格 include
  • ubuntu16.04 UFactory xArm6 xarm_ros环境安装

    UFactory xArm6 的xarm ros开发 背景 环境部署 相机D435i标定 手眼标定 find object 2d or find object 3d 遇到的问题 背景 最近要对机械臂进行开发控制 部分需求是 机器人导航 摄像
  • 闪回技术概念+闪回技术的形式

    闪回技术概念 闪回技术概念 可以实现数据的迅速恢复 而且不依赖于数据备份的技术 闪回技术的形式 1闪回表 Flashback Table 将表回滚到一个过去的时间点或系统改变号scn上 用来快速恢复表 2闪回删除 Flashback Dro
  • Python 判断质数

    使用for循环和列表list判断数字是否为质数 for i in range 2 10 list for j in range 1 i 1 if i j 0 list append i if len list gt 2 print i 不是
  • Unity 资源商店无法登陆,提示链接失效 的解决办法

    出现资源商店无法登陆问题 网络换一下 用自己的手机热点连网 就可以了
  • js——undefined和undeclared

    先看例子 var a a undefined b b is not defined 这样的报错会让我们认为b也是undefined 更让人抓狂的是 var a typeof a undefined typeof b undefined 虽然
  • 分立元器件——电感器

    基本概念 1 1什么是电感器 电感器是能够把电能转为为磁能存储起来的元件 电感器具有电感 能够阻碍电流的变化 具有维持原状态的能力 即当电流突然通过时 它将阻碍电流流过一段时间 当电流突然断开后 它将维持电流一段时间 电感是描述电感器对抗电
  • FPGA- 红外遥控(附代码)

    目录 1 理论学习 2 实操 2 1 整体说明 2 2 红外接收模块 2 2 1 模块框图 2 2 2 状态机 2 2 3 波形图绘制 2 2 4 RTL代码 2 3 LDE灯控制模块 2 3 1 模块框图 2 3 2 波形绘制 2 3 3
  • windows Server 2012 R2扫描漏洞处理(CVE-2018-0886,CVE-2016-2183,CVE-2013-2566,CVE-2015-2808)

    介绍 公司项目安全性检查 发现windows server 2012R2服务器上有图中四个高风险和中风险漏铜需要处理 CVE 2018 0886 1 其中已经指出了解决办法 访问网址 https portal msrc microsoft
  • 你真的会用Python随机数种子吗——Python生成随机数随机种子“失效”:Jupyter中不同cell中生成的随机数不一致

    在Python中经常会生成很多随机数 例如Python自带的random库 科学计算库NumPy 深度学习框架PyTorch等都可以生成随机数 同时为了固定生产的随机数 使得随机数生成可复现 很多时候都会设置随机种子 这样每次都能生成固定的
  • Loaded runtime CuDNN library: 7.5.0 but source was compiled with: 7.6.5

    好不容易安装好CUDA和CUDNN 结果又出问题了 问题字面上的意思似乎是运行的时候使用的CUDNN版是7 5 0的 但编译的版本是7 6 5 那么问题应该是某个地方的版本不对应 网上也有类似的问题 有可能是版本过低的问题 笔者尝试降低了C
  • 因果学习介绍

    目前数据驱动的方法大多是建立数据和标签之间的关联 但是这种关联可能是有偏见或者错误的 因果学习就是想加入知识 来消除这种偏见 机器学习是在大量数据的基础上 应用一些数学理论 尽可能建立一个模型 去拟合这些数据的分布情况 这个模型就像是一个函