【时间序列数据挖掘】ARIMA模型

2023-11-11

目录

0、前言

一、移动平均模型MA

二、自回归模型AR

三、自回归移动平均模型ARMA

四、自回归移动平均模型ARIMA

【总结】


0、前言

传统时间序列分析模型:

ARIMA模型是一个非常灵活的模型,对于时间序列的好多特征都能够进行描述,比如说平稳性特征,季节性特征,趋势性特征。

ARIMA模型可以通过非常成熟的统计方法,比如说极大似然估计,矩估计,贝叶斯估计或者其他一些估计方法得到估计,所以是一个非常好用的工具。

ARIMA模型分成了三部分:AR,I,MA,相当于三个模块的组合。

大家比如说,如果拿到一个时间序列,最想干什么。

如果是一个股票数据,最关心的当然是需要能够知道时刻t~t+h的收益是什么样子的,即期望,

还有方差,作为一个投资者,比如预期我能赚1000万。如果方差是500,那我应该要好好考虑一下我有没有足够的把握能够控制住这个方差,赚到这个1000万。方差不确定性,就能够帮我们甄别做一件事情的风险有多大,计算公式如下:

平稳时间序列一个随机现象的统计特征不随时间变化而改变的随机过程。

非平稳时间序列: 时间序列自身的随机过程的统计特征随时间改变。

一、移动平均模型MA

MA(q):假设一个时间序列由噪音(误差项)以及这些噪音的滞后阶按照不同权重组合起来。计算公式如下:

MA(q)是说,yt是和误差项以及误差项的历史阶受影响的。移动平均模型关注的是自回归模型中的误差项的累加。

二、自回归模型AR

 一般的P阶自回归模型 AR:

 如果随机扰动项是一个白噪声( ut=εt ),则称为一个纯AR(p)过程,记为:

自回归模型AR(p):假设今天的股票收益仅依赖于前天的股票收益,或者是依赖于前p天的股票收益,除此之外不依赖。那么前p天影响到了今天的股票收益。计算公式如下:

自回归模型首先需要确定一个阶数p,表示用几期的历史值来预测当前值。

但是,自回归模型有很多的限制:

(1)自回归模型是用自身的数据进行预测;自回归模型描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。

(2)时间序列数据必须具有平稳性;

(3)自回归只适用于预测与自身前期相关的现象(时间序列的自相关性);

三、自回归移动平均模型ARMA

可以这样理解,如果你经营一个餐馆,今天餐馆的收益和昨天的收益有关系,同时还受市场上发售的消费券的影响(假设消费券是一个随机数的话)。因为我不知道市场发了多少消费券,所以假定消费券是一个随机数。

那么你会发现,那么餐馆的经营既和过去一段时间的业绩有关系,又和消费券的随机数有关系。

那么这两个东西全部综合起来,我们把它叫做自回归移动平均模型ARMA,既有自回归模型AR,又有移动平均模型MA。计算公式如下:

ARMA本质上是一个线性模型,但是它非常灵活,它能够帮助我们描述很多不同的场景。由于它是一个递归的形式,可以通过递归的形式来预测yt-1,yt-2,yt-3,所以ARMA模型是一个非常非常有效的基准的时间序列检测工具。

四、自回归移动平均模型ARIMA

现在,我们想想这个“I”是什么东西,“I”是一个差分项。

也就是说任何一个时间序列,你拿到之后,你需要想一想它是不是平稳的。如果不是平稳的,那么我们需要进行差分,即d=1,yt-yt-1就是差分之后的形式。

这里的p是自回归模型AR的参数,q是移动平均模型MA的参数,d是指d阶差分。

因为差分后的时间序列往往有更好的平稳性,那么差分后的时间序列就可以更好的用ARMA模型来建模。

ARIMA(p,d,q):假设今天的股票收益不仅依赖于前p天的股票收益,同时还与消费券有关。

除了差分, 比如说还有Box-Jenkins方法,是一个比较主观的工具。但是它对于较长的时间序列不是很好用,然后呢还有一些检验上的问题都很难被处理。

差分:将不平稳的时间序列变平稳。

Box-Jenkins方法:通过查看acf和pcf来识别这个时间序列是不是平稳的。

样本自相关函数(autocorrelation function,ACF):展现t时刻和t-k时刻时间序列的关联性,描述的是时间序列观测值与其过去的观测值之间的线性相关性。

样本 偏自相关函数(partial autocorrelation function,PACF) : 在给定了 的条件下,
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【时间序列数据挖掘】ARIMA模型 的相关文章

随机推荐

  • pycharm彻底卸载

    mac中pycharm下载后无法打开 可能是因为使用破解后vm路径改变 完全卸载后再次安装即可 cd Library Preferences rm rf PyCharm2019 x cd Library Logs rm rf PyCharm
  • _T() 和_L() _TEXT __T,L区别与联系详解

    T 和 L TEXT T L区别与联系详解 T 是一个宏 他的作用是让你的程序支持Unicode编码 因为Windows使用两种字符集ANSI和UNICODE 前者就是通常使用的单字节方式 但这种方式处理象中文这样的双字节字符不方便 容易出
  • c++11

    列表 1 boost bind 2 boost function 3 列表初始化 4 nullptr 空指针 6 constexpr函数 6 using类型别名 7 auto类型指示符 8 decltype类型指示符 9 范围for语句 1
  • k8s部署prometheus + grafana

    k8s以Deployment方式部署prometheus grafana 主机说明 系统 ip 角色 cpu 内存 hostname CentOS 7 8 192 168 30 128 master gt 2 gt 2G master1 C
  • 线性回归(Linear Regression)

    引言 说到底 回归任务都是寻找特征与目标之间的关系 我们认为每一个特征或多或少 或积极或消极地对目标产生着影响 我们期望寻找数学表达式来表达出这种影响 一 回归模型 想象一下描述特征与目标之间最简单明了的关系是什么 当然是线性关系了 每个特
  • 解决RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors...CUDA_LAUNCH_BLOCKING=1

    完整报错 RuntimeError CUDA error device side assert triggeredCUDA kernel errors might be asynchronously reported at some oth
  • opencv 中Canny边缘检测算法原理加每一个(分)步骤的代码演示

    1 原理 1 噪声抑制 输入图像经过高斯平滑滤波 减少噪声的影响 2 计算梯度 在平滑后的图像上应用Sobel算子计算梯度幅值和方向 3 非极大值抑制 在梯度方向上 比较每个像素的梯度幅值与其相邻两个像素沿着梯度方向的梯度幅值 如果当前像素
  • 本科毕设研究记录(一)————小样本综述

    本科毕设记录 一 小样本综述 综述 问题定义 相关的领域 核心问题 经验风险最小化 Empirical Risk Minimization 不可靠的经验风险最小化 Unreliable Empirical Risk Minimizer 解决
  • 华为主题包hwt下载_hwt主题文件下载猫和老鼠

    hwt主题文件下载猫和老鼠app是一款针对华为手机精心设定的一款主题软件 软件主题是以经典的猫和老鼠动态图为主 各种不同风格的搞笑图片可以任意下载使用 当它们出现在你的手机屏保上时 让你聊天时更开心 设置方法比较简单 会有相关的教程 hwt
  • 动画的应用,西游记动画效果

    实现背景向后移动以及人物走路的动画效果 实现代码如下
  • AngularJS(13)-包含

    AngularJS 包含 使用 AngularJS 你可以使用 ng include 指令来包含 HTML 内容 实例
  • WIN10下搭建gcc编译环境

    安装make 1 下载make 3 81 链接 https pan baidu com s 1kj2CzmLvl tDTuHJRXKnBg 提取码 v7fh 2 直接安装 全选next 安装路径最好不要改动 3 进入系统属性 选择环境变量
  • 合天Weekly第二十一周

    分析代码可以看出是sql注入 首先使用order by 看下有几列 这里空格被过滤使用 绕过 当输入4的时候不回显所以为3列 提示flag在 falg 表里构造payload 1 union select 1 flag 3 from fla
  • mybatis.type-aliases-package的作用和用法

    第一种在mapper xml文件中的resultMap的type或者parameterType会用到自定义的POJO 其中resultType User 中 User就是自定义的POJO 此时可以使用完全限定名来指定这些POJO的引用 第二
  • lambda 和 Predicate 的妙用示例

    1 过滤集合数据的多种常用方法 public class DemoTest1 public static void main String args List
  • 数据挖掘和机器学习之间,主要有什么区别和联系?

    数据挖掘和机器学习的区别和联系 周志华有一篇很好的论述 机器学习和数据挖掘 可以帮助大家理解 数据挖掘受到很多学科领域的影响 其中数据库 机器学习 统计学无疑影响最大 简言之 对数据挖掘而言 数据库提供数据管理技术 机器学习和统计学提供数据
  • 手势识别Python-OpenCV

    目录 一 选题背景 5 二 设计理念 5 2 1 搭建平台 5 2 2 问题描述 5 2 3 过程概述 6 三 过程论述 6 3 1 数据集生成 6 3 1 1 标准化图片的采集 6 3 1 2肤色检测 7 3 1 3 特征提取 8 3 1
  • Linux系统基础命令

    Linux系统常用基本命令 ls 查看当前目录下所有文件 注 蓝色 文件夹 白色 普通文件 绿色 拥有执行权限的文件 红色 压缩文件 touch 示例 touch filename txt 在当前目录下创建一个文件 注 文件名区分大小写 文
  • 【LeetCode】83. 删除排序链表中的重复元素

    83 删除排序链表中的重复元素 简单 方法 一次遍历 思路 由于给定的链表是排好序的 因此重复的元素在链表中出现的位置是连续的 因此我们只需要对链表进行一次遍历 就可以删除重复的元素 从指针 cur 指向链表的头节点 随后开始对链表进行遍历
  • 【时间序列数据挖掘】ARIMA模型

    目录 0 前言 一 移动平均模型MA 二 自回归模型AR 三 自回归移动平均模型ARMA 四 自回归移动平均模型ARIMA 总结 0 前言 传统时间序列分析模型 ARIMA模型是一个非常灵活的模型 对于时间序列的好多特征都能够进行描述 比如
Powered by Hwhale