statespace.SARIMAX模型:为什么模型使用所有数据来训练模式,并预测训练模型的范围

2024-02-12

我按照教程研究了SARIMAX模型:https://www.digitalocean.com/community/tutorials/a-guide-to-time-series-forecasting-with-arima-in-python-3 https://www.digitalocean.com/community/tutorials/a-guide-to-time-series-forecasting-with-arima-in-python-3。数据的日期范围是 1958-2001 年。

mod = sm.tsa.statespace.SARIMAX(y,
                                order=(1, 1, 1),
                                seasonal_order=(1, 1, 1, 12),
                                enforce_stationarity=False,
                                enforce_invertibility=False)

results = mod.fit()

当拟合 ARIMA 时间序列模型时,我发现作者所有日期范围数据都适合模型参数。但在验证预测时,作者使用了从1998年1月1日开始的日期作为拟合模型数据的日期范围的一部分。

pred = results.get_prediction(start=pd.to_datetime('1998-01-01'), dynamic=False)

我知道在机器学习模型中,训练数据和验证(测试)数据是不同的,我的意思是不同的范围。我的意思是作者说得对吗?为什么这样做(我的意思是使用所有训练数据的原因),我是 SARIMAX 模型的一个新模型。

你们能告诉我更多关于这个模型的信息吗,例如如何预测几天或几周而不仅仅是一个月,我的意思是如何设置参数 order=(1,1,1),seasonal_order=(1, 1, 1, 12 )。谢谢!


作者是对的。当您进行回归(线性、高阶或逻辑回归 - 无关紧要)时 - 与训练数据存在偏差是绝对可以的(例如 - 即使在训练数据上进行逻辑回归也可能会给您带来误报)。

同样代表时间序列。我认为作者想通过这种方式表明模型是正确构建的。

seasonal_order=(1, 1, 1, 12)

如果你看一下 tsa 统计数据文档 http://www.statsmodels.org/stable/generated/statsmodels.tsa.statespace.sarimax.SARIMAX.html您会看到,如果您想使用季度数据进行操作 - 您必须分配最后一个参数 - 值为 4。每月 - 12。这意味着如果您想使用每周数据进行操作,seasonal_order 应该如下所示

seasonal_order=(1, 1, 1, 52)

每日数据将是

seasonal_order=(1, 1, 1, 365)

阶次分量是分别负责非季节性参数 p、d 和 q 的参数。您必须根据您的数据行为找到它们

  • p. You can interpret it as wether enter image description here has an influence on enter image description here. Or in other words, if you have a daily data and p is 6 you can understand it as wether Tuesday data will have an influence on Sunday data.
  • d.差分参数。它定义了流程的集成级别。这意味着你应该应用时间序列多少次差分算子 https://en.wikipedia.org/wiki/Lag_operator为了使你的时间序列平稳
  • q.您可以将其解释为有多少先前的噪声(误差)影响当前值

这里有一个好的answer https://stats.stackexchange.com/questions/44992/what-are-the-values-p-d-q-in-arima如何找到非季节性成分值

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

statespace.SARIMAX模型:为什么模型使用所有数据来训练模式,并预测训练模型的范围 的相关文章

随机推荐