读论文《Crossformer:利用跨维度依赖进行多变量时间序列预测的Transform》

2023-11-09

原文标题《CROSSFORMER: TRANSFORMER UTILIZING CROSSDIMENSION DEPENDENCY FOR MULTIVARIATE TIME SERIES FORECASTING》

动机

基于Transformer的模型将同一时间步所有维度的数据点嵌入到一个特征向量中,试图捕捉不同时间步之间的依赖关系。这样就很好地捕捉到了跨时间依赖关系,但跨维度依赖关系没有被捕捉到。在这里插入图片描述

贡献

1 )深入研究了现有的基于Transformer的MTS预测模型,发现跨维度依赖关系没有得到很好的利用:这些模型只是简单地将特定时间步的所有维度的数据点嵌入到单个向量中,侧重于捕捉不同时间步之间的跨时间依赖关系。如果没有充分、明确地挖掘和利用跨维度依存关系,实证表明其预测能力有限。
2)开发了Crossformer,一个利用跨维度依赖关系的Transformer模型用于MTS预测。这是为数不多的明确探索和利用跨维度依赖关系进行MTS预测的变压器模型(也许是我们所知的第一个)。
3 )在六个真实数据集上的大量实验结果表明了Crossformer相对于现有技术的有效性。

方法

DIMENSION-SEGMENT-WISE EMBEDDING

Transformer最初是为NLP开发的,其中每个嵌入向量代表一个信息词。对于MTS而言,仅一步的单一数值提供的信息很少。在时域上会与附近的值形成信息模式,如下图。可以看出,注意力值具有分段的趋势,即相近的数据点具有相似的注意力权重。在这里插入图片描述
基于此作者提出一个新的嵌入方式,嵌入向量应当表示为单维的一系列片段
在这里插入图片描述
公式如下:
在这里插入图片描述
在这里插入图片描述
将这些 h i , d h_{i,d} hi,d拼成一个二维向量。通过这种方式显示地捕获变量间依赖。

TWO-STAGE ATTENTION LAYER

对于2D的向量组可以参考对于视觉图片的transformer方法,但这里会有两个问题:
1 )与高度和宽度轴可互换的图像不同,MTS的时间和尺寸轴具有不同的含义,因此应该区别对待。
2)直接应用自注意力会导致计算过于复杂
因此,作者提出了两阶段注意力( TSA )层来捕捉二维向量数组之间的跨时间和跨维度依赖
在这里插入图片描述

Cross-Time Stage

Z : , d Z_{:,d} Z:,d代表维度d下的所有时间步,那么维度下的跨时间依赖则表示成:
在这里插入图片描述

Cross-Dimension Stage

作者采用一种路由的方式,进行自注意力。为每个时间步i设置了一个固定数量的可学习向量( c < < D)作为路由器,即作为自注意力中的Query。将所有维度的向量作为Key和Value来聚合来自所有维度的消息。在这里插入图片描述

HIERARCHICAL ENCODER-DECODER

一个分层编码器-解码器,实际多尺度。
在这里插入图片描述
操作如下:
Encoder:
在这里插入图片描述
Decoder:
在这里插入图片描述
预测部分:
在这里插入图片描述

实验

在这里插入图片描述
消融实验:
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读论文《Crossformer:利用跨维度依赖进行多变量时间序列预测的Transform》 的相关文章

随机推荐

  • Docker技术入门

    文章目录 1 Dockerfile概念 2 Dockerfile 指令 FROM 指定基础镜像 RUN执行命令 CMD 容器启动命令 COPY 复制文件 ADD 更高级的复制文件 ENV 设置环境变量 ARG 构建参数 VOLUME 定义匿
  • 通达信板块监控指标_通达信板块监测指标公式

    通达信板块监测指标公式 稀缺资源 SUM 880505 C REF 880505 C 1 1 1000 0 COLORWHITE 军工航天 SUM 880507 C REF 880507 C 1 1 1000 0 COLORRED 智能电网
  • 小米路由器4A千兆版更换5G芯片和硬件布局后出现的刷机问题

    最近又入手一台小米路由器4A千兆版 打算通过 CH341A 编程器刷成老毛子的 结果一拆机傻眼了 整个电路板上的芯片和硬件布局都换了 这是老板子 这是新板子 两张图可以很清楚的看到有很大的变化 那么 之前的那种刷机方式还管用吗 经过测试后出
  • 程序员水平10分级,你的水平属于哪一级?

    随着技术发展 编程悄然融入了我们的生活 我们已然离不开那些程序和编程语言 很多人都在不同程度地谈论着如何编程 也诞生出很多编程语言排行 那么程序员到底应该如何分级呢 首先要明白什么是程序员 设计自己的Apache Web服务器的家伙 制作一
  • css3动画属性解析:【transform -变形】

    前两篇一起学习了animation和transition 的使用 今天我们终于开始学习transform和translate了 其实translate只是transform的一个属性 只是很多初学者对transform 变形 transla
  • Java 数据库中文变成问号???解决办法

    在连接的URL地址后面加上 url jdbc mysql localhost 3306 test useUnicode true characterEncoding utf8 于是在正式项目里面还发现一个 用于批处理的 还是加上吧 免得以后
  • CRC校验详解(附代码示例)

    目录 1 CRC校验原理 2 生成多项式 3 以CRC 16校验为例讲解编程实现 3 3 1 完全按照CRC原理实现校验 3 3 2 工程中常用CRC校验过程 3 3 3 改进的CRC校验过程 4 以CRC 8校验为例讲解查表法 5 以CR
  • IO和NIO

    什么是I O模型 通常情况下I O操作是比较耗时的 所以为了高效的使用硬件 应用程序可以专门设置一个线程进行I O操作 而另外一个线程则利用CPU的空闲去做其他计算 这种为提高应用执行效率而采用的I O操作方法称为I O模型 当然了 在网络
  • 哪种程序员最挣钱?平均月薪30.8K,网友说这是掌握世界的技术

    20出头 工作没有方向 人生迷茫 这是很多同学都会遇到的情况 播妞经常收到男生粉丝的私信问我 到底学什么技术好啊 确实 男生没一门扎实的技能在手 生活和工作的压力都会很大 虽说条条大路通罗马 但是行业之间的差距还是很大的 如何选择一门高薪且
  • 文件md5验证生成器(java版)

    import java applet import java io import java security public class HashFile public static char hexChar 0 1 2 3 4 5 6 7
  • msvcp140.dll丢失的解决方法?三个常见修复解决方法

    msvcp140 dll是Microsoft Visual C Redistributable的一部分 它是一个Windows操作系统中的动态链接库文件 这个文件是由Microsoft开发的 用于提供运行C 程序所需的函数和库 它通常用于许
  • 从源码角度看Linux进程组和线程组

    1 进程ID 线程组ID 设置了CLONE THREAD flag创建的进程 线程 同属于同一个线程组 拥有同一个线程组ID TGID pthread create创建线程的时候 底层通过clone函数实现就指定了CLONE THREAD参
  • WPF中TreeView的使用

    WPF中对树控件的使用主要有两种方法 方法一 对TreeView进行静态搭建 对应的XAML文件代码如下
  • 知识中台,驱动产业智能化升级

    随着人工智能技术的进步 智能化成为产业转型升级的关键抓手 但企业在提升数字化和智能化水平的实践过程中 面临多种挑战 如 移动应用的普及 带来异构数据呈几何级数增长 企业需要深度挖掘数据价值以赋能业务 以及传统 IT 系统缺乏智能化的技术手段
  • MinIO的使用

    MinIO is a high performance object storage solution that provides an Amazon Web Services S3 compatible API and supports
  • sm.ms 图床api使用

    API文档 https sm ms doc API使用样例
  • Git http url的网络连接改进

    通过作者一天的验证 以下方法治标不治本 最终转为ssh上传 请认真甄别 1 修改hosts文件 140 82 113 4 图1的IP Address github com 199 232 69 194 图2的IP Address githu
  • MIT License探讨

    MIT License是一种非常宽松的协议 它本身的条款非常简单明了 在OSI的网站上有其标准模板 https opensource org licenses MIT 直接复制如下 The MIT License MIT Copyright
  • Linux系统的目录结构

    目录 一 Linux系统使用注意 1 Linux严格区分大小写 2 Linux文件 扩展名 3 Linux中所有内容以文件形式保存 4 Linux中存储设备都必须在挂载之后才能使用 二 目录结构 1 Linux分区与Windows分区 2
  • 读论文《Crossformer:利用跨维度依赖进行多变量时间序列预测的Transform》

    原文标题 CROSSFORMER TRANSFORMER UTILIZING CROSSDIMENSION DEPENDENCY FOR MULTIVARIATE TIME SERIES FORECASTING 动机 基于Transform