数据分析——时间序列分析模型(AR,MA,ARMA,ARIMA)

2023-11-01

1.概述

时间序列是某个时间段或者某些时间点对应的不同数值的数值对,这些数值对只有两个具体数据:时间要素、数值要素。时间要素可以是某一个时间段或者某一个时刻。例如一个杂货铺一周(七天)的销售额为时间段的时间要素,而一天二十四小时每个整点所对应的气温为时间点的时间要素。这些时间序列都直接或者间接的反应者某种事物的发展变化趋势与状态,也就是时间序列变化的背后必然蕴藏着非直观的某种变换规律,通过对这些时序数据分析能够解释变化的内在原因,为预测和决策提供可靠的数据支持。

2.时间序列

时间序列按照变化趋势可分为:平稳时间序列,非平稳时间序列。

2.1 平稳时间序列:均值与方差没有系统的变化、而且没有周期性变化。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。

2.2 非平稳时间序列:包含趋势,季节或者周期性的序列,或多种组合。又可以分为有趋势的序列,有趋势和季节性的序列,几种成分混合而成的复合型序列,一般具有长期趋势的时间序列都是非平稳时间序列。

2.3 非平稳转平稳:差分法将有长期趋势的时间序列转换为平稳的时间序列。

                                                              \Delta x_t=x_t-x_{t-1}

形成新的差值为新的时间序列,其实以上公式为一个1阶(次)差分法,如果一阶差分不能够形成平稳的序列就多阶试试看。一次差分之后的序列数值大致相同,那么其实一个一元一次函数就可以拟合;二次差分的数值大致相同可以用二次函数曲线拟合;对数的一次差分的时间序列数值大体相同,配合指数曲线拟合;一次差分的环比值大体相同,配合修正指数曲线;对数一次差分的环比值大体相同,配合Gompertz曲线拟合;倒数一次差分的环比值大体相同,配合Logistic曲线拟合

传统的时间序列分析技术方法:长期趋势影响因素,季节变动影响因素,循环变动影响因素,不规律变动影响因素。

3.常见的时间序列模型

3.1自回归模型AR(p)模型

利用时间序列前期数值与后期数值的相关关系,这里所提及的关系时间序列数值自变量前后的自相关,通过建立一个包含前后期数值的自变量回归方程,说的更直白一些就是第t个时间序列 x_t 由x_1,x_2...x_{t-1}建立方程获取

                                           x_t = \alpha _1x_{t-1}+\alpha _2x_{t-2}+...+\alpha _{p}x_{t-p}+u_t

\alpha _k表示在第k个时间序列自回归系数;u_k为第k个时间序列的白噪声,白噪声我们可以理解为时间序列数值的随机波动,举个栗子可能更容易理解,工厂中生成某一个口径为A零件,但是零件的尺寸的口径会在A数值上上下波动,这个波动不会很大,可能比A大也可能比A小,总体而言u_1+u_2+...+u_t\approx 0.

如果以上的说法还是让人不解,那我们看看简单的1阶自回归的AR(1)的表达式

                                                            x_t=\alpha _1x_{t-1}+u_t

这种1阶理解为只有前一个时刻的时间序列数值会影响当前时刻的时间序列数值,此时只有一个自回归系数。我们一次类推得到2阶自回归的表达式:

                                                    x_t=\alpha_1x_{t-1}+\alpha_2 x_{t-2}+u_t           

现在应该比较清楚AR(p)模型了,p为1时就为AR(1),p为2就为AR(2)。综上所述,如果发现某一个时间序列满足p阶自回归方程那么用AR模型即可做预测。该模型能够量化当前数据与前期数据之间的关系。      

3.2移动平均MA(q)模型

t 时间点的序列值为白噪声 u_t 的加权之和,那么该时间序列服从q阶的移动平均方程:

                                                    x_t = \beta _1u_{t-1}+\beta _2u_{t-2}+...+\beta _{q}u_{t-q}+u_t

当q=2时,MA(2)方程为

                                                                         x_t = \beta _1u_{t-1}+\beta _2u_{t-2}+u_t  

其实移动平均方程是对自回归模型的一个补充。两者组合组合就能得我们下一步要说的ARMA(p,q)模型。该模型解决了随机变动项的求解问题。

3.3自回归滑动平滑ARMA(p,q)模型

不用多说这种模型综合了AR与MA两种模型的优势形成了更强大的模型。

           x_t = \beta _1u_{t-1}+\beta _2u_{t-2}+...+\beta _{p}u_{t-q}+u_t+\alpha _1x_{t-1}+\alpha _2x_{t-2}+...+\alpha _{p}x_{t-p}

3.4 ARIMA(p,q,d)

AR/MA/ARMA用于分析平稳时间序列,接下来所说的ARIMA通过差分可以用于处理非平稳时间序列。参数d为差分的次数。相比于ARMA模型,该模型需要将不平稳数据进行d次差分形成一个稳定的时间序列数据,然后采用ARMA模型

小结

以上介绍了四种时间序列分析的模型,时间序列分析的原理主要在于分解时间序列中的各种变动成分,再去分析分解之后的成分变动规律,所有的模型中都是从时间序列数值本身的自相关性,将非平稳转换为平稳,移动平均方法与相关性分析。

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析——时间序列分析模型(AR,MA,ARMA,ARIMA) 的相关文章

  • java 限流策略

    概要 在大数据量高并发访问时 经常会出现服务或接口面对暴涨的请求而不可用的情况 甚至引发连锁反映导致整个系统崩溃 此时你需要使用的技术手段之一就是限流 当请求达到一定的并发数或速率 就进行等待 排队 降级 拒绝服务等 在限流时 常见的两种算
  • ASP.NET Core 中获取客户端(Client)IP的方法

    简介 本文主要介绍ASP NET Core中获取客户端 Client IP的方法代码 以及负载均衡的情况获取客户端IP 1 第一种方法 1 在Startup cs中ConfigureSerivces中配置 services Configur
  • 软件测试----性能测试

    性能测试 通过性能测试工具模拟正常状态 峰值状态及异常负载状态下对系统的各项性能指标进行测试的一系列活动验证软件系统是否达到了用户期望的性能需求 同时发现系统中可能存在的性能瓶颈及缺陷进而进行优化 性能测试的目的 1 验证系统性能是否满足预
  • C# 操作CAD报错【COMException (0x8001010A)消息筛选器显示应用程序正在使用中】的一种处理方式

    C 操作CAD报错 COMException 0x8001010A 消息筛选器显示应用程序正在使用中 使用了dynamic关键字依然无法解决 程序运行了5次可能出现3次此错误 网上搜索了很多方法都没有用 于是使用了do while循环解决此

随机推荐

  • 【小程序】报错:no such file or directory, access ‘wxfile://usr/miniprogramLog/log2‘

    出现场景 在微信小程序开发中 使用真机调试的时候 出现这个错误 解决方式 将真机调试由2 0切换到1 0 原因 开放社区中大佬的评论 真机调试一直报错 no such file or directory access 微信开放社区
  • BUUCTF-Misc部分

    二维码 附件压缩包下载下来是一个二维码图片 直接用工具查看 并没有直接给出flag 猜测是压缩包文件 使用winhex查看 明显的提示pk 压缩文件 可以用binwalk命令分离文件 也可以直接修改后缀 部分可能会存在损坏文件的问题 先复制
  • JAVA 获取实时汇率

    聚合数据中有很多我们会用到的数据 下面是获取实时汇率的方式 key值聚合数据注册后可获取 需要练习借用的 请评论回复 public void exchangeRate String urlIDR http op juhe cn onebox
  • 安装pip3

    安装pip3 yum install epel release yum install python36 y yum install python36 setuptools easy install 3 6 pip
  • uniapp之小程序setData迁移

    uniapp修改data中的值 第一次用uniapp 踩坑了 坑1 不能用this setData 得用this set 对象 属性名 值 坑2 data的属性得用this data做目标对象 贴上代码 export default dat
  • CCF-CSP真题《202303-1 田地丈量》思路+python,c++,java满分题解

    想查看其他题的真题及题解的同学可以前往查看 CCF CSP真题附题解大全 试题编号 202303 1 试题名称 田地丈量 时间限制 1 0s 内存限制 512 0MB 问题描述 问题描述 西西艾弗岛上散落着 n 块田地 每块田地可视为平面直
  • 华为校招机试题-查找充电设备组合-2023年

    题目描述 某个充电站 可提供n个充电设备 每个充电设备均有对应的输出功率 任意个充电设备组合的输出功率总和 均构成功率集合P的1个元素 功率集合P的最优元素 表示最接近充电站最大输出功率p max的元素 输入描述 输入为3行 第1行为充电设
  • C++中引用(&)的用法和应用实例

    对于习惯使用C进行开发的朋友们 在看到c 中出现的 符号 可能会犯迷糊 因为在C语言中这个符号表示了取地址符 但是在C 中它却有着不同的用途 掌握C 的 符号 是提高代码执行效率和增强代码质量的一个很好的办法 在 c 学习提高篇 3 隐式指
  • 代码审查审什么

    代码审查审什么 看着很多人做代码审查重点审格式和命名 制定的代码规范也主要偏重代码格式和命名 我真想骂一句操蛋 这真是浪费时间又解决不了问题 此篇文章就是骂完操蛋后奋笔快速敲下来的 有不妥之处请大家谅解 一 目的 为啥要花费时间要搞人工代码
  • 再学C语言(一)——关于ifndef

    关于ifndef的解释 ifndef 是 if not defined 的简写 是预处理功能 宏定义 文件包含 条件编译 当中的条件编译 可以根据是否已经定义了一个变量来进行分支选择 ifndef的作用 防止头文件的重复包含和编译 把头文件
  • LeetCode-1615. 最大网络秩

    1615 最大网络秩 题目说明 n 座城市和一些连接这些城市的道路 roads 共同组成一个基础设施网络 每个 roads i ai bi 都表示在城市 ai 和 bi 之间有一条双向道路 两座不同城市构成的 城市对 的 网络秩 定义为 与
  • Windows中你用过的Git账户藏在哪里?

    最近换工作了 新公司也没有自己的Git服务器 所以还是选择了之前用过的Coding net 之前注册的账户用的是上一家公司的邮箱 为免出现不愉快的事情 重新注册了一个账户 顺顺利利地新建项目 clone push 晚上回到家 想clone一
  • mysql增量抽取方法_DataX增量抽取数据

    datax增量项目地址 datax作业配置文件 datax json job setting speed channel 16 content reader name mysqlreader parameter splitPk id use
  • 【数据结构】带头结点的单链表

    数据结构 带头结点的单链表 链表 逻辑连续 物理上不一定连续 带头结点的单链表 结构体 定义结构体 typedef int ELEM TYPE typedef struct Node ELEM TYPE mdata struct Node
  • 九、C++编译过程详解

    九 C 编译过程详解 1 什么是编译器 2 多文件编译与链接 3 为什么需要构建系统 Makefile 4 CMake CMakeLists txt 5 CMake中的静态库和动态库 1 什么是编译器 编译器是一个根据源代码生成机器码的程序
  • Windows获取密码及hash

    前言 在拿到一台 Windows 的管理员权限以后 可以通过多种方法获取 Windows 系统的明文密码或者 hash 值 这将有利于我们在内网中扩大渗透范围 0x01 Mimikatz Mimikat是一个法国人写的轻量级调试器 Mimi
  • 视频压缩之冗余

    视频压缩之冗余 对于数字视频信号 数据量很大 不管是存储还是传输的需要 做压缩处理是必须的 下面我们会做进一步阐述 以记录数字视频的YUV分量格式为例 YUV分别代表亮度与两个色差信号 例如对于现有的PAL制电视系统 其亮度信号采样频率为1
  • 整流器+逆变器。 前级采用PWM整流器,采用双闭环前馈解耦控制

    整流器 逆变器 前级采用PWM整流器 采用双闭环前馈解耦控制 实现并网单位功率因数 稳定直流电压 后级采用两电平逆变器 通过双闭环前馈解耦控制 稳定输出电压 整个仿真环境完全离散化 运行时间更快 主电路与控制部分以不同的步长运行 更加贴合实
  • CentOS7.4 离线升级openssh8.4

    CentOS7 4 离线升级openssh8 4 前言 工作中需要离线升级openssh 网上一些资料说要先安装telnet 这里省略 大家可以先安装telnet 预防更新ssh失败 下载openssl安装包 去https www open
  • 数据分析——时间序列分析模型(AR,MA,ARMA,ARIMA)

    1 概述 时间序列是某个时间段或者某些时间点对应的不同数值的数值对 这些数值对只有两个具体数据 时间要素 数值要素 时间要素可以是某一个时间段或者某一个时刻 例如一个杂货铺一周 七天 的销售额为时间段的时间要素 而一天二十四小时每个整点所对