arima 公式_小白快速上手数据分析1

2023-11-12

ARIMA时间序列分析

作用：ARIMA时间序列分析通常用于对单列具有时间序列的数据进行预测，例如销售量预测，股票收盘价预测等等 ○ 输入：单列数据序列的数据，例如每个月销售额，每天股票的价格，通常数据量为15-50 条； ○ 输出：对未来5-15 天进行预测

ARIMA模型的全称叫做自回归移动平均模型，也记作ARIMA(p，d，q)，是统计模型中最常见的一种用来进行时间序列预测的模型。ARIMA模型建模的基本条件是要求待预测的数列满足平稳的条件，即个体值要围绕序列均值上下波动，不能有明显的上升或下降趋势，如果出现上升或下降趋势(不稳定数据)，是无法捕捉到规律的，需要对原始序列进行差分平稳化处理。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的，常常受政策和新闻的影响而波动，可以使用ADF检验用于稳定性检验，使用差分分析对数据进行稳定性处理。

从步骤上讲，ARIMA时间序列分析共分为五个步骤：

○ Step1：ARIMA模型要求序列满足平稳性，查看ADF检验结果，根据分析t值，分析其是否可以显著地拒绝序列不平稳的假设(p＜0.05或0.01)

○ Step2：查看差分前后数据对比图，判断是否平稳(上下幅度不大)，同时对时间序列进行偏自相关分析、自相关分析，根据截尾情况估算其p、q值

○ Step3：ARIMA模型要求时间序列数据具备纯随机性，即模型残差为白噪声，查看模型检验表，根据Q统计量的p值对模型白噪声进行检验，也可以结合信息准则AIC和BIC值进行分析(越低越好)，也可通过ACF/PACF图进行分析

○ Step4：根据模型参数表，得出模型公式

○ Step5：结合时间序列分析图进行分析，得到向后预测的阶数结果

ARIMA模型案例

1. 数据

当前已有我国的人均生产总值GDP(2000~2019年)的数据，希望通过这些历史数据预测后面15年的人均GDP情况。部分数据如下(来自我国国家统计局)^[2]：

小提示： ○ 选择对预测问题有意义的时间单位很重要，比如我国历年人均GDP 、我国历年财政收入等，一般以年作为单位。对于其他的数据集，根据需要可以按月或周为单位。 ○ 为了保证结果的正确性，时间一般不能有间隔，如2017 ，2018 ，2020

2. 理论 ARIMA模型主要用法是根据已有的历史数据对未来数据进行预测，其基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列，用一定的数学模型来近似地描述这个序列。这个模型一旦被识破后就可以从时间序列的过去值来预测未来值。 ARIMA 模型可分为三个部分，AR 自回归模型，I 即差分，MA 滑动平均模型。

○ AR 模型：是描述当前值与历史值之间的关系的模型，是一种用变量自身的历史事件数据对自身进行预测的方法 ○ MA 模型：自回归模型中误差项的累加，它能够有效地消除预测中的随机波动 ○ 差分I ：时间序列变量的本期值与其滞后值相减的运算称为差分。滞后值：有些变量的反应会出现延迟现象，比如国家调整货币政策，可能今年出台，要到明年甚至后年才能见效

MPai 能够智能寻优找到最佳的AR 模型，I 和MA 模型，并且给出最终的模型预测结果。除了MPai 的智能推荐，用户也可以自定义AR 模型、I 和MA 模型，即分别设置回归系数p ，差分阶数d (时间序列平稳时所做的差分次数)和移动平均项数q ，然后进行模型的构建。具体如何设置，可以根据MPai 智能提供的p 值或者q 值考虑，以及使用ADF 检验可以得出适合的差分阶数d 值。

3. 操作

本次分析希望得到MPai自动推荐的ARIMA模型，因此4个参数(自回归阶数p，差分阶数d值和移动平均阶数q，向后预测阶数)均采取MPai默认的方式。操作如下图：

4. MPai输出结果

MPai的输出结果共有3个6个图，分别如下：

○ ADF检验表，该表用于检验时间序列是否平稳

○ 最终差分序列图，得到序列平稳后的结果图

○ 最终差分数据的自相关图(ACF)、偏自相关图(PACF)，根据截尾情况估算其p、q值

○ ARIMA模型检验表，该表可以反映模型的残差是否存在自相关

○ 模型残差的自相关图(ACF)、偏自相关图(PACF)，检验残差是否为白噪声

○ 模型参数表，展示本次模型的参数结果

○ 模型的预测结果(共往后15期的模型预测值)

同时，MPai还输出模型的真实、拟合、预测的折线图，便于用户直观的分析模型的拟合情况和预测情况。

5. 具体分析

上表展示了模型ADF 检验的结果，包括差分阶数、t 值，显著性P 值，AIC 值等，用于检验时间序列是否平稳。由上表可见，该时间序列数据ADF 检验的t 统计量为5.183 ，p 值为1.000 ，1% 、5% 、10% 临界值分别为-3.833 、-3.031 、-2.656 。p =1 ＞0.05 ，不能拒绝原假设，序列不平稳。对序列进行一阶差分再进行ADF 检验。一阶差分后数据ADF 检验结果显示p=0.381 ＞0.05 ，不能拒绝原假设，序列不平稳，对序列进行二阶差分再进行ADF 检验。二阶差分后数据ADF 检验结果显示p =0.000 ＜0.01 ，有高于99% 的把握拒绝原假设，此时序列平稳。因此在后续进行分析时，应该基于2 阶差分数据进行分析才可以。此外，MPai 还输出了模型最终差分序列图、最终差分数据的自相关图(ACF )、偏自相关图(PACF )，便于用户直观的分析模型。

上表格展示本次模型检验结果，包括样本数，自由度(Df Residuals)、Q统计量、信息准则和模型的拟合优度。本次模型的构建时，MPai自动构建输出模型为：ARIMA(0，1，1)

ARIMA模型构建后残差一般不存在自相关性，即模型残差为白噪声，查看模型检验表，根据Q统计量的p值，对模型白噪声进行检验，其原假设为：残差是白噪声(p值大于0.1为白噪声)；常见情况下直接对Q6进行分析即可，Q6用于检测残差前6阶自相关系数是否满足白噪声。从Q统计量结果看，Q6的p值为0.130大于0.1，则在0.1的显著性水平下，接受原假设，模型的残差是白噪声，模型基本满足要求。拟合优度代表时间序列的拟合程度，

R²的值越接近1效果越好。MPai还提供模型的残差自相关图(ACF)和偏自相关图(PACF)，方便用户更直观地分析残差是否存在自相关性。

除此之外，若用户是自己进行模型构建，并希望能够得到对比结果，可以结合信息准则AIC和BIC值进行对比，两值越小越好。此处显示的AIC值已经是各种潜在可能模型的最小值了。

上述表格展示了本次模型参数结果，包括模型的系数、标准差、T 检验结果和置信区间，用于分析模型公式。本次构建模型时，MPai 自动构建输出模型的公式： y(t)= 3313.157+0.998* ε ( t-1 )

MPai 时间序列图采用不同的颜色，展示了真实值和拟合值的情况，并展示了最近15 期的预测情况。从图可得知，真实数据和拟合数据基本上吻合，说明模型的拟合较好，并且整体呈现出增长的趋势。

时间序列分析表是本次分析的重点，ARIMA 模型的目的就在于预测未来的数据情况。该表格对接下来的15 期的数据进行了预测，上图展示了部分图表的数据。阶数1 (时间)代表2020 年，向后2 期是指2021 年。根据分析的经验来看，ARIMA 模型预测一般1 期和2 期的结果较为可靠。使用ARIMA 模型对(2000-2019 )的数据进行预测，最终预测出我国2020 年人均GDP 为74938.66 元。 6. 划重点

ARIMA模型分析中涉及的理论和注意事项，如下：

○ 选择对预测问题有意义的时间单位很重要，一般选取能够体现数据的变化规律的。 ○ MPai 能够智能寻优找到最佳的AR 模型，I 和MA 模型，并且给出最终的模型预测结果。 ○ 用户若要自定义回归系数p ，差分阶数d 和移动平均项数q ，也可参考Mpai 提供的值，自行设置。

○ 若用户没有设定向后预测阶数，MPai默认提供未来15期的预测数据，但针对ARIMA模型来讲，一般情况下向后1期或者向后2期的预测较为准确，往后的预测数据预测准确率较低，通常只作为参考

7. 参考文献

[1] 广州万灵数据科技有限公司.自动数据处理与多协议接入的数据分析平台.https://www.mpaidata.com. 2020-04-22-。

[2] 中华人民共和国统计局.中国统计年鉴[M].北京：中国统计出版社,2018.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

arima 公式

arima 公式_小白快速上手数据分析1 的相关文章

最近很火的ChatGPT和GPT4

ChatGPT 全名 Chat Generative Pre trained Transformer 美国OpenAI研发的聊天机器人程序于2022年11月30日发布 ChatGPT是人工智能技术驱动的自然语言处理工具它能够通过理解和学
深度学习-ubuntu18.04+RTX3080+cuda11.2+cudnn8.1.0下安装polarstream全纪录

安装创建一个python3 7的虚拟环境 conda create name polarstream python 3 7 激活虚拟环境 source activate polarstream 以下操作均在虚拟环境中进行安装与cuda和
linxu命令个人使用总结

find命令查找文件 find name 文件名 curl命令访问网址 cur url sh命令开启服务 sh X sh 进入对应文件夹后直接输入sh X sh 不在X sh对应文件夹下则用file path ps A 显示所有进程 p
spi,ClassLoader,双亲委托模式

转载 https www cnblogs com hiyujie p wo xueJava1ClassLoader yu shuang qin wei tuo mo sh html 1 ClassLoader分类 Java虚拟机会创建三类C
2013最受欢迎儿童安全座椅品牌评选结果揭晓

亲贝网讯 1月17日消息近日 2013最受欢迎儿童安全座椅品牌评选结果揭晓榜单中宝得适葛莱好孩子 kiddy concord 智高斯迪姆欧贝宝贝第一艾乐贝贝共10家儿童安全座椅品牌最终摘得2013年最受欢迎儿童安全座椅品
苹果iOS App上架流程，非iOS开发人员上架教程

iOS应用上线发布流程一般包含相关证书文件的配置 Xcode的设置 App Store Connect填写App的相关信息 ipa包上传审核结果以及相关邮件回复相关证书文件的配置与Xcode的设置一般由iOS开发人员来完成下面只讲拿到
linux下正确卸载rpm包

查看应用 elasticsearch 为例 rpm qa grep i elasticsearch 执行结果 root bogon elasticsearch head rpm qa grep i elasticsearch elastic
解决this作用域不够的问题

先看下方的vue代码主要功能是点击按钮实现将笑话渲染到页面上 div div
单链表和循环单链表的基本操作

单链表和循环单链表的基本操作 2021 8 23 lkm 该项目里面包含单链表操作以及循环单链表操作注意循环单链表判断条件为p L include
如何读取resources目录下的文件路径（九种方式）

前情提要本文中提供了九种方式获取resources目录下文件的方式其中打印文件的方法如下根据文件路径读取文件内容 param fileInPath throws IOException public static void getFi
children和 siblings的菜单选择
货仓选址（贪心）

我之前在多篇博客中提到货仓选址却发现从未仔细介绍过货舱选址今天就来好好说一下货舱选址这个问题就以这个图来说我们假设Ap 1 gt x gt Ap 那么距离之和也就是 x A1 x A2 x Ap A p 1 x A p 2 x An
vue中router路由的原理？两种路由模式如何实现？(vue2) -(上)

平时我们编写路由时通常直接下载插件使用在main js文件中引入直接通过引入vue router中的Router通过Vue use使用以后定义一个routeMap数组里边是我们编写路由的地方最后通过实例化一个 Router实例将r
SaperaLT 简单介绍

2019独角兽企业重金招聘Python工程师标准 gt gt gt Sapera Teledyne DALSA 安装SDK包同其他大厂的平台软件包一样分为Runtime和SDK俩种安装包 SDK安装完成后在开始菜单里面会有俩个目录 T
求解矩阵的秩相关算法（C语言）

矩阵的秩在线性代数中一个矩阵A的列秩是A的线性独立的纵列的极大数通常表示为r A rk A 或rank A 一个矩阵A的列秩是A的线性独立的纵列的极大数目类似地行秩是A的线性无关的横行的极大数目即如果把矩阵看成一个个行向量或者列
莫队算法（区间查询）

适用情况 1 只查询不修改 2 已知 L R 的答案可在O 1 时间内求出 L R 1 L R 1 L 1 R L 1 R 3 该算法复杂度为 O n sqrt n 分析思路由上知计算 L R 的时间为 L L R R 将询问看作点
利用D盘内存给C盘扩容

步骤一右键此电脑管理步骤二磁盘管理步骤三 D盘分区为主分区右击压缩卷填写需要的内存然后点击压缩步骤四 D盘右键更改驱动器号和路径把D盘改成本地磁盘A 步骤五在压缩出来的内存中右键新建简单卷将其设置成磁盘D
表(Table)和段(Segment)之间是什么关系

Q A 表 Table 和段 Segment 之间是什么关系 English 作者 fuyuncat 来源 www HelloDBA com 日期 2009 08 28 02 13 24 问表 Table 和段 Segment 之间是什么
原型和原型链继承

JavaScript 原型 JavaScript 是一种通过原型实现继承的语言与别的高级语言是有区别的像 java C 是通过类型决定继承关系的 JavaScript 是的动态的弱类型语言总之可以认为 JavaScript 中所有都

随机推荐

python连接pymysql主机目标无响应_python3之pymysql模块

1 python3 MySQL数据库链接模块 PyMySQL 是在 Python3 x 版本中用于连接 MySQL 服务器的一个库 Python2中则使用mysqldb PyMySQL 遵循 Python 数据库 API v2 0 规范并
MSYS2 Mingw Cygwin对比

系列文章目录文章目录系列文章目录前言一 MSYS2 是什么前言 Mingw 仅支持 32 bit 程序现在一般用 Mingw w64 既支持 32 也支持 64 bit Mingw W64 官网一个教程 MSYS2 是一个 w
关于 document.onclick

document onclick事件当在浏览器内容域中当发生一次鼠标单机事件就产生一个事件对象
融云获评「创业邦 · 最具创新价值出海服务商」

点击报名 9 月 21 日融云直播课 8 月 22 日 23 日创业邦主办的 2023 DEMO WORLD 全球开放式创新大会暨企业出海未来大会在上海举行会上发布了创业邦 2023 出海企业创新价值 100 强融云荣登榜单获评
Oracle 数据库中删除表空间的详细步骤与示例

系列文章目录文章目录系列文章目录前言一查看表空间二数据迁移和备份三下线表空间中的对象四删除表空间五删除完成后的操作总结前言在 Oracle 数据库中表空间是存储数据的逻辑容器有时候我们可能需要删除不再使
深度学习(20):nerf论文翻译与学习

目录 1 Introduction 2 Related Work 3 Neural Radiance Field Scene Representation 4 Volume Rendering with Radiance Fields 5
Python中出现UnboundLocalError: local variable ‘xxx‘ referenced before assignment情况的解决方法

UnboundLocalError local variable xxx referenced before assignment 在函数外部已经定义了变量n 在函数内部对该变量进行运算运行时会遇到了这样的错误主要是因为没有让解释器清楚
使用Hyperledger Fabric Java SDK 构建和部署区块链网络（windows下）

在区块链解决方案中区块链网络作为后端与应用程序前端一起使用SDK与网络通信为了建立前端和后端之间的通信 Hyperledger Fabric社区为各种编程语言提供了许多SDK 如NodeJS SDK和Java SDK 此代码模式解释了使
PHP保留两位小数的三种方法

PHP保留两位小数的三种方法 ps 本人亲测阿里云2核4G5M的服务器性价比很高新用户一块多一天老用户三块多一天最高可以买三年感兴趣的可以戳一下阿里云折扣服务器 PHP保留两位小数的几种方法 link http www phpd
用Compose shape把外框做成封闭图形

Compose shape之后为何会成这个样子以下并板框的实际图样只论述方法解决办法 compose shape 时不要把整个outline框起来用tempgroup一段一段的选择选完后complete 特别要注意的是要选中相应的
mysql数据库商业版与社区版的区别

1 商业版本组织管理与测试环节控制更严格稳定性方面会比社区版本更稳定 2 mysql是成熟产品商业版与社区版之间性能方面相差不大 3 商业版不遵守GPL协议社区版遵守GPL协议可以免费使用 4 使用商业版后可以购买相关的服务享受7
DVWA全级别详细通关教程

目录暴力破解 Brute Force low Medium High Impossible 命令注入 Command Injection low Medium High Impossible CSRF 跨站请求伪造 low Medium
哈工大团队开源医学智能问诊大模型

原文 CVHub 门头沟学院AI视觉实验室御用公众号学术科研就业 185篇原创内容公众号 Title HuaTuo Tuning LLaMA Model with Chinese Medical KnowledgePDF https
【MySQL】MySQL索引详解

Mysql索引 0 写在前面 1 为什么要使用索引 2 常见的索引模型 3 索引维护 4 回表举例子 0 写在前面文章中包含了 1 什么是索引 2 索引的数据结构以及各自的使用场景 3 为什么要设置主键自增 4 基于主键索引和普通索引
如何修改tomcat默认端口号8080的方法

1 背景在默认情况下 tomcat的端口是8080 使用了两个tomcat 那么就需要修改其中的一个的端口号才能使得两个同时工作 2 方法 2 1改动一那么如何修改tomcat的端口号呢首先到安装目录或者解压目录下找到conf文
理解c++中左值与右值的一篇文章

C 中的左值与右值说明这一部分内容只是帮助理解 C 11 中左值与右值的概念在编程实践中因为编译器优化的存在特别是其中的返回值优化 Return Value Optimization RVO 使你不需要额外关注左值与右值的区别像
Idea新建项目名后出现中括号别名

Idea新建项目名后出现中括号别名 1 修改pom xml文件的 artifactId标签和项目名一致 2 项目名出现中括号是因为iml文件名和项目文件名不一样需要更改iml文件名即可
开关稳压DC—DC降压电路简介

在做数字压力开关项目时电源输入要求是12V 24V 10 系统内需要5V和3 3V的电源这时提供了三个方案从中选择方案一使用24V 5V和5V 3 3V的LDO线性稳压芯片方案二使用24V 12V 12V 5V 5V 3 3V种
SIP Using SDP with Offer/Answer Model

根据RFC3261 13 2 1所述 SIP使用的Offer Answer模型是建立在对话环境下的 RFC中还特意对Offer Answer交互有限制 1 初始Offer必须在INVITE消息或者第一个可靠的非失败型响应中注当时RFC3
arima 公式_小白快速上手数据分析1

ARIMA时间序列分析作用 ARIMA时间序列分析通常用于对单列具有时间序列的数据进行预测例如销售量预测股票收盘价预测等等输入单列数据序列的数据例如每个月销售额每天股票的价格通常数据量为15 50 条输出对未来5 15

arima 公式_小白快速上手数据分析1

arima 公式_小白快速上手数据分析1 的相关文章

随机推荐

热门标签