论文阅读——基于观测数据的时间序列因果推断综述

2023-11-02

国防科大2022年3月的综述

 1.Granger

多元Granger: VAR+条件集,P(X|Y)=>条件VAR模型,比较y与y^来判定因果关系。

(加入条件集,消除其它变量影响)

条件Granger:用矩阵表示参数,简化计算。并提出基于\chi _{}^{2}检验的因果判定方法。

检验方法的创新,或者先变换空间在创新都能提高Granger适用性。

Lasso-GRanger:添加Lasso进行变量筛选,降低计算复杂度。

Copular-Granger:结合Lasso-Granger和潜在因果模型,用D-分离排除混杂因素,用Granger的“非超常分布”识别因果关系。(有点意思——那可以结合反事实计算吗?)

2.信息论

这些方法课衡量因果关系的强度,但对方向性未准确。

互信息:一个变量 X中包含的关于另一个变量Y的信息量;或者说X由于已知Y而减少的不确定性

它是一个非负量,如果MI显著不等于 0,则认为两个变量之间存在因果关系,反之亦然。

缺点:由于互信息具有对称性,因此在确定因果关系后还需要其他方法进一步定向。(可以结合Granger和互信息吗?感觉有希望)

传递熵: TE是一种度量因果关系的非对称指标。如果 X和Y的历史信息所决定的
X的不确定度,小于单独通过 X的历史信息所决定的 X的不确定度,那么Y就是 X的原
因,即

缺点:TE在应用于非平稳序列因果推断时精度较低,高维序列中的变量选择也制约了其计算效率。 

接下来的两篇文章可以看看,比较新,分别是2020和2022的文章。可以了解根源推理方法)

Rashidi等[28]提出了符号动态归一化传递熵(Symbolic Dynamic-based Normalized Direct TE,SDNDTE)并将其应用于复杂系统根源变量定位中。SDNDTE首先利用归一化操作排除变量自信息对因果推断造成的影响,然后将时间序列转化为基于频率计数的状态转移矩阵,通过符号发射矩阵的估计代替传统多维核概率密度函数拟合方法。SDNDTE能不仅能推断多元非平稳序列中的因果关系,还能有效降低计算复杂度、减少虚假因果的出现。此外,Zeng等[29]提出了归一化有效传递
熵(Normalized Effective TE,NETE),NETE在保持数据概率分布不变的情况,将传递熵减
去随机打乱数据后得到的随机传递熵,以消除时间序列的噪声和非平稳性造成的影响。 

3.因果网络结构学习

Huang等[45]提出了一种用于非平稳和异构时间序列因果推断的CD-NOD(Constraint-based causal Discovery from Nonstationary/heterogeneous Data)方法。该方法利用变量代理和条件独立性检验重构因果网络框架,然后利用潜在因果模型中隐含的数据分布进行定向。相比此前的方法,CO-NOD是非参数的,对数据分布没有严格限制,且不依赖于时间窗口分割,还能在带有混杂因素的异质数据中识别因果关系。

传统的因果网络结构学习算法依赖于因果充分性假设[5],即假设系统中不存在未观测的
共同驱动因素,但真实系统中往往存在未观测变量(隐变量)。

2020年,Runge[52]又提出了PCMCI+算法,通过分离存在时延和同期的条件集,以及修改单个条件独立性测试的条件集,可以在高召回率的前提下有效减少虚假因果,降低时间复杂度。

4.基于结构因果模型的方法 

第一代:LiNGAM

初始条件:线性,无未观测的共因,误差服从非高斯分布。

因果方向判断方法:因果机制的不对称性和因果机制的不对称性。

5.基于非线性状态空间模型的方法

2012年,Sugihara等[66]提出了收敛交叉映射(Convergent Cross Mapping, CCM)方法,该
方法基于Takens定理[67],通过状态空间重构推断因果关系.

什么是Takens定理?(需要补充)

如果变量 X可以通过变量Y的时延嵌入重构系统来预测,那么 X和Y之间就存在因果效应。

基于非线性状态空间模型的时间序列因果推断方法假设交互作用发生在一个潜在的动力系统中,然后基于Takens定理和非线性状态空间重构来推断因果关系。Takens定理可以用于重构时间序列中的动力学信息。它证明在满足某些条件时,从一个吸引子到重构空间的映射是一一对应的,只要找到合理的嵌入维数,就能实现相空间中轨道的重构,并保持其原来的微分结构不变。 

方法一:NLIM 非线性相互依赖度量

 方法二:非线性相互依赖

 Krakovská和Jakubík[74]利用重构状态空间预测原理,提出了基于交叉预测(Cross 
Prediction,CP)和混合预测(Predictability Improvement,PI)的因果关系推断方法。其中
CP方法通过自预测和交叉预测的平均绝对误差判定因果关系,PI则通过两种混合优化预测
方法判定因果关系。CP和PI能适用于多变量系统,还能用于因果推断结果的敏感性分析。

(这两篇文章可以看看,应该与预测有关) 

Liu等[81]利用条件熵检测反馈驱动的交易和反映市场回报流的“自因果性”,并使用传递熵识别新闻情绪和市场回报的信息流相关的交易活动。

(这篇文章可以看看,与反馈机制有关)

Li和Convertino[91]提出一种互信息和传递熵的最优信息流生态系统模型,通过从时间序列中提取复杂生态系统的预测因果网络,提供广泛的生态信息。Oh等[92]提出一种相对符号传递熵来研究南大洋的南极绕极波大规模气候现象,并解释了厄尔尼诺-南方涛动的特征。 

(一个是预测因果网络,什么样的网络?)

(相对符号传递熵,如何进行符号推理?)

Zeng等[96]利用基于归一化修正传递熵和改进的因果网络结构学习算法,将遥测参数因果关系与注意力机制的LSTM相结合,实现了低误报率的航天器遥测数据异常检测。

(2022年的文章,可能用处不大)

Tian等[99]提出一种基于CCM的重大工业事故主因告警和根因追踪方法,利用CCM识别变量之间的因果方向和间接因果关系,作为后续告警根因追踪的依据。

(用CCM进行识别,到底根因到哪个阶段?)

总结:

1.这篇文章总结的还不错,比之前大连理工任伟杰等人的综述详细,深入些。

2.对于我想要的内容,还是没有太大的帮助。

3.选取的文章都比较新,想了解相关方向,值得去看看。

4.现有的推理还是指图上的推理,未总结与应用结合的推理方式。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读——基于观测数据的时间序列因果推断综述 的相关文章

随机推荐

  • StackGAN笔记

    Stack可译做堆叠 就是在GAN上面再放上一个GAN 作者讲述的自己的解决思路 原来难以生成高分辨率的图像 他们分解了这个问题 把生成高分辨率图片这个任务分解成两个更为简单的任务 就是文中说的一个GAN生成大致的形状和颜色 第二个GAN生
  • 自主HttpServer实现(C++实战项目)

    文章目录 项目介绍 CGI技术 概念 原理 设计框架 日志文件 TCPServer 任务类 初始化与启动HttpServer HTTP请求结构 HTTP响应结构 线程回调 EndPoint类 EndPoint主体框架 读取HTTP请求 处理
  • tidymodels-workflow工作流

    在阅读这篇文章前 我强烈建议你先读一下tidymodels入门篇 tidymodels用于机器学习的细节 首先对tidymodels有一个整体的认知 今天主要介绍workflow的用法 workflow可以把你的数据预处理步骤和模型连接起来
  • 深聊性能测试,从入门到放弃之:性能测试基准与阶段

    如何做性能测试 1 引言 2 性能测试内容 2 1 基准测试 2 2 日常压力测试 2 3 峰值压力测试 2 4 容量测试 2 5 稳定性测试 3 性能测试阶段 3 1 测试确认 3 2 确定通过标准 3 3 测试设计 3 4 测试环境准备
  • 【问题解决】后端如何以文件流的形式返回本地资源给前端,提供下载服务

    后端以文件流的形式返回本地资源 文件地址 String path PDFpath File file new File PDFpath 读取生成的PDF文件 InputStream inputStream OutputStream outp
  • python中文主客观分类

    查了很久发现主客观分析的方法很多 但是数据集少的可怜 能直接使用的库更少 好不容易找到一个 收藏一下 Github 页面 https github com liuhuanyong ZhuguanDetection 下载与使用方法 git c
  • ELK之logstash单节点安装

    ELK之logstash单节点安装 最近在搞ELK 写个文章记录分享一下经验 去官网上下载对应版本的logstash安装包 将工具包上传至服务器 1 解压工具包 命令 tar xzvf logstash tar gz 2 配置logstas
  • Pycharm全局搜索窗口关不掉的解决方案 (ctrl shift F)

    Pycharm全局搜索窗口可以ctrl shift F打开 但是找不到直接关闭的按钮 清空搜索内容也关不掉 只能把窗口挪走 再次ctrl shift F也不会打开新的窗口 一度有点烦恼 后来发现 按ESC就行了 按ESC就行了 按ESC就行
  • JAVA基础常见简答题面试题

    1 为什么java是半编译半解释性的语言 java如何实现跨平台 java的编译器先将其编译为class文件 也就是字节码 然后将字节码交由jvm java虚拟机 解释执行 所以很多地方都说 java是一种半编译 半解释执行 的语言 JAV
  • 拓扑排序 topologicalSort

    拓扑排序 topologicalSort 背景知识 图 Graph 顶点和边 vertex and edge 无向图 Undirected Graph 有向图 Directed Graph 有向图的degree 图中的环 基本概念 什么是拓
  • Angular自定义组件实现ngModel双向绑定

    1 自定义组件ts Component selector app custom tree templateUrl custom tree component html styles providers provide NG VALUE AC
  • [系统安全] 四十八.恶意软件分析 (4)Cape沙箱批量提取动态API特征

    终于忙完初稿 开心地写一篇博客 您可能之前看到过我写的类似文章 为什么还要重复撰写呢 只是想更好地帮助初学者了解病毒逆向分析和系统安全 更加成体系且不破坏之前的系列 因此 我重新开设了这个专栏 准备系统整理和深入学习系统安全 逆向分析和恶意
  • JavaScript-内置对象和包装类型

    作为JS面试题中经常被问到的考点 怎么能不好好了解 理解呢 或许标题中的名词我们不是很了解 但是我相信我们一定都实践过 而且不止一次 只不过当时我们或许停留在使用的层次 没有深入了解原理 在此之前的我也是这样的 不过学习知识 果真是 N 1
  • 恋爱与婚姻的区别

    恋爱是走在婚姻的路上 婚姻是恋爱的最好归宿 不是每一对恋人都能走进婚姻的殿堂 也不是每一对夫妻都能白头偕老 恋爱和婚姻不同 恋爱是没上保险的爱情 而婚姻是上了保险的爱情 在一般情况下 一对恋人容易和平相处 而一对夫妻却常常因为一点小事 争论
  • Anaconda命令-网站大全

    Anaconda命令 网站大全 命令行初始化 conda init 在安装好Anaconda之后配置命令行自动激活base环境 支持PowerShell和Cmd 配置pip Anaconda软件源 清华源 pip 网站 pypi 镜像站使用
  • 数据结构(使用尾插法实现单链表)

    1 线性表的链式存储就是单链表 单链表通过一组任意的存储单元来存储线性表的数据元素 逻辑相邻 存储离散 单链表对于每一个链表结点 不但存储自身数据 还开辟了存储一个指向后继结点的指针 2 单链表相比顺序表 优点 解决了顺序表需要大量连续存储
  • 规则引擎Drools使用 第十三篇 Drools 编写规则文件的规范

    我们在进行drl类型的规则文件编写时尽量遵循如下规范 所有的规则文件 drl 应统一放在一个规定的文件夹中 如 rules文件夹 书写的每个规则应尽量加上注释 注释要清晰明了 言简意赅 同一类型的对象尽量放在一个规则文件中 如所有Stude
  • 梅科尔工作室-李朝阳-鸿蒙笔记3

    list组件 列表组件 相当于大盒子里面套小盒子 示例 父子组件 即主 次两个文件之间内容的调用 if else循环 改变组件的渲染状态 判断是否需要改变状态 示例 for循环 开发框架提供循环渲染 ForEach组件 来迭代数组 并为每一
  • Sqlite3之C++开发常用API总结

    文章目录 Sqlite3之C 开发常用API总结 使用流程 sqlite3 open Sqlite3 prepare sqlite3 bind sqlite3 step sqlite3 column sqlite3 exec sqlite3
  • 论文阅读——基于观测数据的时间序列因果推断综述

    国防科大2022年3月的综述 1 Granger 多元Granger VAR 条件集 P X Y gt 条件VAR模型 比较y与y 来判定因果关系 加入条件集 消除其它变量影响 条件Granger 用矩阵表示参数 简化计算 并提出基于检验的