1.概述
时间序列是某个时间段或者某些时间点对应的不同数值的数值对,这些数值对只有两个具体数据:时间要素、数值要素。时间要素可以是某一个时间段或者某一个时刻。例如一个杂货铺一周(七天)的销售额为时间段的时间要素,而一天二十四小时每个整点所对应的气温为时间点的时间要素。这些时间序列都直接或者间接的反应者某种事物的发展变化趋势与状态,也就是时间序列变化的背后必然蕴藏着非直观的某种变换规律,通过对这些时序数据分析能够解释变化的内在原因,为预测和决策提供可靠的数据支持。
2.时间序列
时间序列按照变化趋势可分为:平稳时间序列,非平稳时间序列。
2.1 平稳时间序列:均值与方差没有系统的变化、而且没有周期性变化。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。
2.2 非平稳时间序列:包含趋势,季节或者周期性的序列,或多种组合。又可以分为有趋势的序列,有趋势和季节性的序列,几种成分混合而成的复合型序列,一般具有长期趋势的时间序列都是非平稳时间序列。
2.3 非平稳转平稳:差分法将有长期趋势的时间序列转换为平稳的时间序列。
形成新的差值为新的时间序列,其实以上公式为一个1阶(次)差分法,如果一阶差分不能够形成平稳的序列就多阶试试看。一次差分之后的序列数值大致相同,那么其实一个一元一次函数就可以拟合;二次差分的数值大致相同可以用二次函数曲线拟合;对数的一次差分的时间序列数值大体相同,配合指数曲线拟合;一次差分的环比值大体相同,配合修正指数曲线;对数一次差分的环比值大体相同,配合Gompertz曲线拟合;倒数一次差分的环比值大体相同,配合Logistic曲线拟合
传统的时间序列分析技术方法:长期趋势影响因素,季节变动影响因素,循环变动影响因素,不规律变动影响因素。
3.常见的时间序列模型
3.1自回归模型AR(p)模型
利用时间序列前期数值与后期数值的相关关系,这里所提及的关系时间序列数值自变量前后的自相关,通过建立一个包含前后期数值的自变量回归方程,说的更直白一些就是第t个时间序列 由建立方程获取
表示在第k个时间序列自回归系数;为第k个时间序列的白噪声,白噪声我们可以理解为时间序列数值的随机波动,举个栗子可能更容易理解,工厂中生成某一个口径为A零件,但是零件的尺寸的口径会在A数值上上下波动,这个波动不会很大,可能比A大也可能比A小,总体而言.
如果以上的说法还是让人不解,那我们看看简单的1阶自回归的AR(1)的表达式
这种1阶理解为只有前一个时刻的时间序列数值会影响当前时刻的时间序列数值,此时只有一个自回归系数。我们一次类推得到2阶自回归的表达式:
现在应该比较清楚AR(p)模型了,p为1时就为AR(1),p为2就为AR(2)。综上所述,如果发现某一个时间序列满足p阶自回归方程那么用AR模型即可做预测。该模型能够量化当前数据与前期数据之间的关系。
3.2移动平均MA(q)模型
t 时间点的序列值为白噪声 的加权之和,那么该时间序列服从q阶的移动平均方程:
当q=2时,MA(2)方程为
其实移动平均方程是对自回归模型的一个补充。两者组合组合就能得我们下一步要说的ARMA(p,q)模型。该模型解决了随机变动项的求解问题。
3.3自回归滑动平滑ARMA(p,q)模型
不用多说这种模型综合了AR与MA两种模型的优势形成了更强大的模型。
3.4 ARIMA(p,q,d)
AR/MA/ARMA用于分析平稳时间序列,接下来所说的ARIMA通过差分可以用于处理非平稳时间序列。参数d为差分的次数。相比于ARMA模型,该模型需要将不平稳数据进行d次差分形成一个稳定的时间序列数据,然后采用ARMA模型
小结
以上介绍了四种时间序列分析的模型,时间序列分析的原理主要在于分解时间序列中的各种变动成分,再去分析分解之后的成分变动规律,所有的模型中都是从时间序列数值本身的自相关性,将非平稳转换为平稳,移动平均方法与相关性分析。