arima 公式_小白快速上手数据分析1

2023-11-12

ARIMA时间序列分析

作用:ARIMA时间序列分析通常用于对单列具有时间序列的数据进行预测,例如销售量预测,股票收盘价预测等等 ○  输入:单列数据序列的数据,例如每个月销售额,每天股票的价格,通常数据量为15-50 条; ○  输出:对未来5-15 天进行预测 316feb81dc0b14c4705b9332e72a47e0.gif

ARIMA模型的全称叫做自回归移动平均模型,也记作ARIMA(p,d,q),是统计模型中最常见的一种用来进行时间序列预测的模型。ARIMA模型建模的基本条件是要求待预测的数列满足平稳的条件,即个体值要围绕序列均值上下波动,不能有明显的上升或下降趋势,如果出现上升或下降趋势(不稳定数据),是无法捕捉到规律的,需要对原始序列进行差分平稳化处理。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动,可以使用ADF检验用于稳定性检验,使用差分分析对数据进行稳定性处理。

fdecbe45ffc8bc2153a3f958bab0532c.gif

从步骤上讲,ARIMA时间序列分析共分为五个步骤:

316feb81dc0b14c4705b9332e72a47e0.gif

○    Step1:ARIMA模型要求序列满足平稳性,查看ADF检验结果,根据分析t值,分析其是否可以显著地拒绝序列不平稳的假设(p<0.05或0.01)

○    Step2:查看差分前后数据对比图,判断是否平稳(上下幅度不大),同时对时间序列进行偏自相关分析、自相关分析,根据截尾情况估算其p、q值

○    Step3:ARIMA模型要求时间序列数据具备纯随机性,即模型残差为白噪声,查看模型检验表,根据Q统计量的p值对模型白噪声进行检验,也可以结合信息准则AIC和BIC值进行分析(越低越好),也可通过ACF/PACF图进行分析

○    Step4:根据模型参数表,得出模型公式

○    Step5:结合时间序列分析图进行分析,得到向后预测的阶数结果

fdecbe45ffc8bc2153a3f958bab0532c.gif

ARIMA模型案例

1. 数据

当前已有我国的人均生产总值GDP(2000~2019年)的数据,希望通过这些历史数据预测后面15年的人均GDP情况。部分数据如下(来自我国国家统计局)[2]

c8d66e5699121955cd7ba95673aadd60.png

316feb81dc0b14c4705b9332e72a47e0.gif 小提示: ○     选择对预测问题有意义的时间单位很重要,比如我国历年人均GDP 、我国历年财政收入等,一般以年作为单位。对于其他的数据集,根据需要可以按月或周为单位。 ○     为了保证结果的正确性,时间一般不能有间隔,如2017 ,2018 ,2020 fdecbe45ffc8bc2153a3f958bab0532c.gif 2. 理论 ARIMA模型主要用法是根据已有的历史数据对未来数据进行预测,其基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似地描述这个序列。这个模型一旦被识破后就可以从时间序列的过去值来预测未来值。 ARIMA 模型可分为三个部分,AR 自回归模型,I 即差分 ,MA 滑动平均模型。 316feb81dc0b14c4705b9332e72a47e0.gif ○    AR 模 型:是描述当前值与历史值之间的关系的模型,是一种用变量自身的历史事件数据对自身进行预测的方法 ○    MA 模型:自回归模型中误差项的累加,它能够有效地消除预测中的随机波动 ○     差分I :时间序列变量的本期值与其滞后值相减的运算称为差分。滞后值:有些变量的反应会出现延迟现象,比如国家调整货币政策,可能今年出台,要到明年甚至后年才能见效 fdecbe45ffc8bc2153a3f958bab0532c.gifMPai 能够智能寻优找到最佳的AR 模型,I 和MA 模型,并且给出最终的模型预测结果。 除了MPai 的智能推荐,用户也可以自定义AR 模型、I 和MA 模型,即分别设置回归系数p , 差分阶数d (时间序列平稳时所做的差分次数)和移动平均项数q ,然后进行模型的构建。具体如何设置,可以根据MPai 智能提供的p 值或者q 值考虑,以及使用ADF 检验可以得出适合的差分阶数d 值。

3. 操作

本次分析希望得到MPai自动推荐的ARIMA模型,因此4个参数(自回归阶数p,差分阶数d值和移动平均阶数q,向后预测阶数)均采取MPai默认的方式。操作如下图:

831834198002f88e7b2712fbbc68db85.png

23d23fcac0abc4c367c1ebe484633eb9.png

4. MPai输出结果

MPai的输出结果共有3个6个图,分别如下:

○     ADF检验表,该表用于检验时间序列是否平稳

○     最终差分序列图,得到序列平稳后的结果图

○    最终差分数据的自相关图(ACF)、偏自相关图(PACF),根据截尾情况估算其p、q值

○    ARIMA模型检验表,该表可以反映模型的残差是否存在自相关

○     模型残差的自相关图(ACF)、偏自相关图(PACF),检验残差是否为白噪声

○     模型参数表,展示本次模型的参数结果

○     模型的预测结果(共往后15期的模型预测值)

同时,MPai还输出模型的真实、拟合、预测的折线图,便于用户直观的分析模型的拟合情况和预测情况。

fdecbe45ffc8bc2153a3f958bab0532c.gif5. 具体分析

867199179ea26c2f973e0e9fe3e96344.png

上表展示了模型ADF 检验的结果,包括差分阶数、t 值,显著性P 值,AIC 值等,用于检验时间序列是否平稳。由上表可见,该时间序列数据ADF 检验的t 统计量为5.183 ,p 值为1.000 ,1% 、5% 、10% 临界值分别为-3.833 、-3.031 、-2.656 。p =1 >0.05 ,不能拒绝原假设,序列不平稳。对序列进行一阶差分再进行ADF 检验。 一阶差分后数据ADF 检验结果显示p=0.381 >0.05 ,不能拒绝原假设,序列不平稳,对序列进行二阶差分再进行ADF 检验。二阶差分后数据ADF 检验结果显示p =0.000 <0.01 ,有高于99% 的把握拒绝原假设,此时序列平稳。 因此在后续进行分析时,应该基于2 阶差分数据进行分析才可以。此外,MPai 还输出了模型最终差分序列图、最终差分数据的自相关图(ACF )、偏自相关图(PACF ),便于用户直观的分析模型。

b8acb9efd74de7b2f4cb65d00126cefa.png

上表格展示本次模型检验结果,包括样本数,自由度(Df Residuals)、Q统计量、信息准则和模型的拟合优度。本次模型的构建时,MPai自动构建输出模型为:ARIMA(0,1,1)

ARIMA模型构建后残差一般不存在自相关性,即模型残差为白噪声,查看模型检验表,根据Q统计量的p值,对模型白噪声进行检验,其原假设为:残差是白噪声(p值大于0.1为白噪声);常见情况下直接对Q6进行分析即可,Q6用于检测残差前6阶自相关系数是否满足白噪声。从Q统计量结果看,Q6的p值为0.130大于0.1,则在0.1的显著性水平下,接受原假设,模型的残差是白噪声,模型基本满足要求。拟合优度代表时间序列的拟合程度,

R²的值越接近1效果越好。MPai还提供模型的残差自相关图(ACF)和偏自相关图(PACF),方便用户更直观地分析残差是否存在自相关性。

除此之外,若用户是自己进行模型构建,并希望能够得到对比结果,可以结合信息准则AIC和BIC值进行对比,两值越小越好。此处显示的AIC值已经是各种潜在可能模型的最小值了。

ca0c6a1ae24f697f659207fbb8ad5e79.png

上述表格展示了本次模型参数结果,包括模型的系数、标准差、T 检验结果和置信区间,用于分析模型公式。 本次构建模型时,MPai 自动构建输出模型的公式: y(t)= 3313.157+0.998* ε ( t-1 )

c5bee6bc02193a8b9f8af24cf116b456.png

MPai 时间序列图采用不同的颜色,展示了真实值和拟合值的情况,并展示了最近15 期的预测情况。从图可得知,真实数据和拟合数据基本上吻合,说明模型的拟合较好,并且整体呈现出增长的趋势。

1da44628d595d529bb840ab6adc69114.png

时间序列分析表是本次分析的重点,ARIMA 模型的目的就在于预测未来的数据情况。该表格对接下来的15 期的数据进行了预测,上图展示了部分图表的数据。阶数1 (时间)代表2020 年,向后2 期是指2021 年。根据分析的经验来看,ARIMA 模型预测一般1 期和2 期的结果较为可靠。 使用ARIMA 模型对(2000-2019 )的数据进行预测,最终预测出我国2020 年人均GDP 为74938.66 元。 6. 划重点

ARIMA模型分析中涉及的理论和注意事项,如下:

○     选择对预测问题有意义的时间单位很重要,一般选取能够体现数据的变化规律的。 ○     MPai 能够智能寻优找到最佳的AR 模型,I 和MA 模型,并且给出最终的模型预测结果。 ○     用户若要自定义回归系数p ,差分阶数d 和移动平均项 数q ,也可参考Mpai 提供的值,自行设置。

○     若用户没有设定向后预测阶数,MPai默认提供未来15期的预测数据,但针对ARIMA模型来讲,一般情况下向后1期或者向后2期的预测较为准确,往后的预测数据预测准确率较低,通常只作为参考

fdecbe45ffc8bc2153a3f958bab0532c.gif 7. 参考文献

[1] 广州万灵数据科技有限公司.自动数据处理与多协议接入的数据分析平台.https://www.mpaidata.com. 2020-04-22-。

[2] 中华人民共和国统计局.中国统计年鉴[M].北京:中国统计出版社,2018.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

arima 公式_小白快速上手数据分析1 的相关文章

  • 最近很火的ChatGPT和GPT4

    ChatGPT 全名 Chat Generative Pre trained Transformer 美国OpenAI研发的聊天机器人程序 于2022年11月30日发布 ChatGPT是人工智能技术驱动的自然语言处理工具 它能够通过理解和学
  • 深度学习-ubuntu18.04+RTX3080+cuda11.2+cudnn8.1.0下安装polarstream全纪录

    安装 创建一个python3 7的虚拟环境 conda create name polarstream python 3 7 激活虚拟环境 source activate polarstream 以下操作均在虚拟环境中进行 安装与cuda和
  • linxu命令个人使用总结

    find命令查找文件 find name 文件名 curl命令访问网址 cur url sh命令开启服务 sh X sh 进入对应文件夹后 直接输入sh X sh 不在X sh对应文件夹下 则用file path ps A 显示所有进程 p
  • spi,ClassLoader,双亲委托模式

    转载 https www cnblogs com hiyujie p wo xueJava1ClassLoader yu shuang qin wei tuo mo sh html 1 ClassLoader分类 Java虚拟机会创建三类C
  • 2013最受欢迎儿童安全座椅品牌评选结果揭晓

    亲贝网讯 1月17日消息 近日 2013最受欢迎儿童安全座椅品牌 评选结果揭晓 榜单中 宝得适 葛莱 好孩子 kiddy concord 智高 斯迪姆 欧贝 宝贝第一 艾乐贝贝共10家儿童安全座椅品牌最终摘得2013年最受欢迎儿童安全座椅品
  • 苹果iOS App上架流程,非iOS开发人员上架教程

    iOS应用上线发布流程一般包含相关证书文件的配置 Xcode的设置 App Store Connect填写App的相关信息 ipa包上传 审核结果以及相关邮件回复 相关证书文件的配置与Xcode的设置一般由iOS开发人员来完成 下面只讲拿到
  • linux下正确卸载rpm包

    查看应用 elasticsearch 为例 rpm qa grep i elasticsearch 执行结果 root bogon elasticsearch head rpm qa grep i elasticsearch elastic
  • 解决this作用域不够的问题

    先看下方的vue代码 主要功能是点击按钮 实现将笑话渲染到页面上 div div
  • 单链表和循环单链表的基本操作

    单链表和循环单链表的基本操作 2021 8 23 lkm 该项目里面包含单链表操作以及循环单链表操作 注意 循环单链表判断条件为p L include
  • 如何读取resources目录下的文件路径(九种方式)

    前情提要 本文中提供了九种方式获取resources目录下文件的方式 其中打印文件的方法如下 根据文件路径读取文件内容 param fileInPath throws IOException public static void getFi
  • children和 siblings的菜单选择

  • 货仓选址(贪心)

    我之前在多篇博客中提到货仓选址 却发现从未仔细介绍过货舱选址 今天就来好好说一下货舱选址这个问题 就以这个图来说 我们假设Ap 1 gt x gt Ap 那么距离之和也就是 x A1 x A2 x Ap A p 1 x A p 2 x An
  • vue中router路由的原理?两种路由模式如何实现?(vue2) -(上)

    平时我们编写路由时 通常直接下载插件使用 在main js文件中引入直接通过引入vue router中的Router通过Vue use使用以后定义一个routeMap数组 里边是我们编写路由的地方 最后通过实例化一个 Router实例 将r
  • SaperaLT 简单介绍

    2019独角兽企业重金招聘Python工程师标准 gt gt gt Sapera Teledyne DALSA 安装SDK包 同其他大厂的平台软件包一样 分为Runtime和SDK俩种安装包 SDK安装完成后 在开始菜单里面会有俩个目录 T
  • 求解矩阵的秩相关算法(C语言)

    矩阵的秩 在线性代数中 一个矩阵A的列秩是A的线性独立的纵列的极大数 通常表示为r A rk A 或rank A 一个矩阵A的列秩是A的线性独立的纵列的极大数目 类似地 行秩是A的线性无关的横行的极大数目 即如果把矩阵看成一个个行向量或者列
  • 莫队算法(区间查询)

    适用情况 1 只查询 不修改 2 已知 L R 的答案 可在O 1 时间内求出 L R 1 L R 1 L 1 R L 1 R 3 该算法复杂度为 O n sqrt n 分析思路 由上知 计算 L R 的时间为 L L R R 将询问看作点
  • 利用D盘内存给C盘扩容

    步骤一 右键此电脑 管理 步骤二 磁盘管理 步骤三 D盘分区为主分区 右击 压缩卷 填写需要的内存 然后点击压缩 步骤四 D盘右键 更改驱动器号和路径 把D盘改成 本地磁盘A 步骤五 在压缩出来的内存中 右键 新建简单卷 将其设置成磁盘D
  • 表(Table)和段(Segment)之间是什么关系

    Q A 表 Table 和段 Segment 之间是什么关系 English 作者 fuyuncat 来源 www HelloDBA com 日期 2009 08 28 02 13 24 问 表 Table 和段 Segment 之间是什么
  • 原型和原型链继承

    JavaScript 原型 JavaScript 是一种通过原型实现继承的语言与别的高级语言是有区别的 像 java C 是通 过类型决定继承关系的 JavaScript 是的动态的弱类型语言 总之可以认为 JavaScript 中所有 都

随机推荐

  • python连接pymysql主机目标无响应_python3之pymysql模块

    1 python3 MySQL数据库链接模块 PyMySQL 是在 Python3 x 版本中用于连接 MySQL 服务器的一个库 Python2中则使用mysqldb PyMySQL 遵循 Python 数据库 API v2 0 规范 并
  • MSYS2 Mingw Cygwin对比

    系列文章目录 文章目录 系列文章目录 前言 一 MSYS2 是什么 前言 Mingw 仅支持 32 bit 程序 现在一般用 Mingw w64 既支持 32 也支持 64 bit Mingw W64 官网 一个教程 MSYS2 是一个 w
  • 关于 document.onclick

    document onclick事件 当在浏览器内容域中当发生一次鼠标单机事件就产生一个事件对象
  • 融云获评「创业邦 · 最具创新价值出海服务商」

    点击报名 9 月 21 日融云直播课 8 月 22 日 23 日 创业邦主办的 2023 DEMO WORLD 全球开放式创新大会暨企业出海未来大会 在上海举行 会上发布了 创业邦 2023 出海企业创新价值 100 强 融云荣登榜单 获评
  • Oracle 数据库中删除表空间的详细步骤与示例

    系列文章目录 文章目录 系列文章目录 前言 一 查看表空间 二 数据迁移和备份 三 下线表空间中的对象 四 删除表空间 五 删除完成后的操作 总结 前言 在 Oracle 数据库中 表空间是存储数据的逻辑容器 有时候 我们可能需要删除不再使
  • 深度学习(20):nerf论文翻译与学习

    目录 1 Introduction 2 Related Work 3 Neural Radiance Field Scene Representation 4 Volume Rendering with Radiance Fields 5
  • Python中出现UnboundLocalError: local variable ‘xxx‘ referenced before assignment情况的解决方法

    UnboundLocalError local variable xxx referenced before assignment 在函数外部已经定义了变量n 在函数内部对该变量进行运算 运行时会遇到了这样的错误 主要是因为没有让解释器清楚
  • 使用Hyperledger Fabric Java SDK 构建和部署区块链网络(windows下)

    在区块链解决方案中 区块链网络作为后端与应用程序前端一起使用SDK与网络通信 为了建立前端和后端之间的通信 Hyperledger Fabric社区为各种编程语言提供了许多SDK 如NodeJS SDK和Java SDK 此代码模式解释了使
  • PHP保留两位小数的三种方法

    PHP保留两位小数的三种方法 ps 本人亲测 阿里云2核4G5M的服务器性价比很高 新用户一块多一天 老用户三块多一天 最高可以买三年 感兴趣的可以戳一下 阿里云折扣服务器 PHP保留两位小数的几种方法 link http www phpd
  • 用Compose shape把外框做成封闭图形

    Compose shape之后为何会成这个样子 以下并板框的实际图样 只论述方法 解决办法 compose shape 时不要把整个outline框起来 用tempgroup一段一段的选择 选完后complete 特别要注意的是要选中相应的
  • mysql数据库商业版与社区版的区别

    1 商业版本组织管理与测试环节控制更严格 稳定性方面 会比社区版本更稳定 2 mysql是成熟产品 商业版与社区版之间性能方面相差不大 3 商业版不遵守GPL协议 社区版遵守GPL协议可以免费使用 4 使用商业版后可以购买相关的服务 享受7
  • DVWA全级别详细通关教程

    目录 暴力破解 Brute Force low Medium High Impossible 命令注入 Command Injection low Medium High Impossible CSRF 跨站请求伪造 low Medium
  • 哈工大团队开源医学智能问诊大模型

    原文 CVHub 门头沟学院AI视觉实验室御用公众号 学术 科研 就业 185篇原创内容 公众号 Title HuaTuo Tuning LLaMA Model with Chinese Medical KnowledgePDF https
  • 【MySQL】MySQL索引详解

    Mysql索引 0 写在前面 1 为什么要使用索引 2 常见的索引模型 3 索引维护 4 回表 举例子 0 写在前面 文章中包含了 1 什么是索引 2 索引的数据结构 以及各自的使用场景 3 为什么要设置主键自增 4 基于主键索引和普通索引
  • 如何修改tomcat默认端口号8080的方法

    1 背景 在默认情况下 tomcat的端口是8080 使用了两个tomcat 那么就需要修改其中的一个的端口号才能使得两个同时工作 2 方法 2 1改动一 那么 如何修改tomcat的端口号呢 首先到安装目录 或者解压目录 下找到conf文
  • 理解c++中左值与右值的一篇文章

    C 中的左值与右值 说明 这一部分内容只是帮助理解 C 11 中左值与右值的概念 在编程实践中 因为编译器优化的存在 特别是其中的返回值优化 Return Value Optimization RVO 使你不需要额外关注左值与右值的区别 像
  • Idea新建项目名后出现中括号别名

    Idea新建项目名后出现中括号别名 1 修改pom xml文件的 artifactId标签 和项目名一致 2 项目名出现中括号是因为iml文件名和项目文件名不一样 需要更改iml文件名即可
  • 开关稳压DC—DC降压电路简介

    在做数字压力开关项目时 电源输入要求是12V 24V 10 系统内需要5V和3 3V的电源 这时提供了三个方案从中选择 方案一 使用24V 5V和5V 3 3V的LDO线性稳压芯片 方案二 使用24V 12V 12V 5V 5V 3 3V种
  • SIP Using SDP with Offer/Answer Model

    根据RFC3261 13 2 1所述 SIP使用的Offer Answer模型是建立在对话环境下的 RFC中还特意对Offer Answer交互有限制 1 初始Offer必须在INVITE消息或者第一个可靠的非失败型响应中 注 当时RFC3
  • arima 公式_小白快速上手数据分析1

    ARIMA时间序列分析 作用 ARIMA时间序列分析通常用于对单列具有时间序列的数据进行预测 例如销售量预测 股票收盘价预测等等 输入 单列数据序列的数据 例如每个月销售额 每天股票的价格 通常数据量为15 50 条 输出 对未来5 15