Python 中的自动 ARIMA 导致趋势拟合预测不佳

2024-04-12

ARIMA 新手，尝试使用自动 ARIMA 在 Python 中对数据集进行建模。我正在使用 auto-ARIMA，因为我相信它会更好地定义 p、d 和 q 的值，但结果很差，我需要一些指导。请参阅下面我的可重复尝试

尝试如下：

    # DEPENDENCIES
    import pandas as pd 
    import numpy as np 
    import matplotlib.pyplot as plt
    import pmdarima as pm 
    from pmdarima.model_selection import train_test_split 
    from statsmodels.tsa.stattools import adfuller
    from pmdarima.arima import ADFTest
    from pmdarima import auto_arima
    from sklearn.metrics import r2_score 

# CREATE DATA
data_plot = pd.DataFrame(data removed)

# SET INDEX
data_plot['date_index'] = pd.to_datetime(data_plot['date']
data_plot.set_index('date_index', inplace=True)

# CREATE ARIMA DATASET
arima_data = data_plot[['value']]
arima_data

# PLOT DATA
arima_data['value'].plot(figsize=(7,4))

The above steps result in a dataset that should look like this.

# Dicky Fuller test for stationarity 
adf_test = ADFTest(alpha = 0.05)
adf_test.should_diff(arima_data)

结果 = 0.9867 表示非平稳数据，应在自动 arima 过程中稍后通过适当的差分处理来处理。

# Assign training and test subsets - 80:20 split 

print('Dataset dimensions;', arima_data.shape)
train_data = arima_data[:-24]
test_data = arima_data[-24:]
print('Training data dimension:', train_data.shape, round((len(train_data)/len(arima_data)*100),2),'% of dataset')
print('Test data dimension:', test_data.shape, round((len(train_data)/len(arima_data)*100),2),'% of dataset')

# Plot training & test data
plt.plot(train_data)
plt.plot(test_data)

 # Run auto arima
    arima_model = auto_arima(train_data, start_p=0, d=1, start_q=0,
    max_p=5, max_d=5, max_q=5,
    start_P=0, D=1, start_Q=0, max_P=5, max_D=5,
    max_Q=5, m=12, seasonal=True,
    stationary=False,
    error_action='warn', trace=True,
    suppress_warnings=True, stepwise=True,
    random_state=20, n_fits=50)
        
    print(arima_model.aic())

输出表明最佳模型是'ARIMA(1,1,1)(0,1,0)[12]'与 AIC 1725.35484

#Store predicted values and view resultant df

prediction = pd.DataFrame(arima_model.predict(n_periods=25), index=test_data.index)
prediction.columns = ['predicted_value']
prediction

# Plot prediction against test and training trends 

plt.figure(figsize=(7,4))
plt.plot(train_data, label="Training")
plt.plot(test_data, label="Test")
plt.plot(prediction, label="Predicted")
plt.legend(loc='upper right')
plt.show()

# Finding r2 model score
    test_data['predicted_value'] = prediction 
    r2_score(test_data['value'], test_data['predicted_value'])

结果：-6.985

ARIMA 的假设需要在应用于数据之前进行检查。其中之一是数据需要稳定，即它不应该具有趋势或季节性。您可以通过绘图来检查趋势，该趋势在图表中可见，然后呈上升趋势。

1.您也可以从图表中得出季节性或使用迪克富勒检验来检查假设。

import statsmodels.tsa.stattools as ts
ts.adfuller(data.col)

检查这个答案，如何执行和阅读广告完整测试已经得到很好的解释。如何解读 adfuller 测试结果？ https://stackoverflow.com/questions/47349422/how-to-interpret-adfuller-test-results

始终检查 ACF 和 PACF 图，以及哪些滞后超出限制，显示自相关。检查是否存在平稳性

正如 Jose 所解释的，可以通过差分来使数据平稳化。

SARIMA 算法考虑季节性成分 (p,d,q) 和 (S,P',D',Q') 以及外生变量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

datascience

Prediction

ARIMA

pmdarima

Python 中的自动 ARIMA 导致趋势拟合预测不佳的相关文章

Spyder 和 Jupyter 有什么区别？

我正在学习Python用于数据科学但我的问题是我仍然不明白Spyder和Jupyter之间的区别我希望你们能帮助我理解其中的区别我将不胜感激以下只是这两个工具的基本摘要 Jupyter 是一个非常流行的用于数据分析的应用程序它是一
在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
使用 Python 将列名称与 CSV 文件中的数据对齐

这是我用来将数据写入 csv 文件的代码 with open temp csv a as fp a csv writer fp delimiter t data faceXpos faceYpos faceHeight faceWidth
如何从 Windows 7 PC 上完全卸载 Python 2.7

从这里安装了Python 2 7 https www python org downloads release python 279 https www python org downloads release python 279 然后我
绘制对数轴

我想使用 matplotlib 绘制一张带有一个对数轴的图我一直在阅读文档但无法弄清楚语法我知道这可能很简单 scale linear 在情节争论中但我似乎无法正确理解示例程序 import pylab import matplo
为什么 pandas.DataFrame.update 会更改更新后的数据帧的数据类型？

出于显而易见的原因我想在更新后将列的数据类型保留为 int 有什么想法为什么这不能按预期工作吗 import pandas as pd df1 pd DataFrame a 1 b 2 c foo a 3 b 4 c baz df2 pd
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
在 Python 中倾斜数组

我有一个 2D 数组我将使用它保存为灰度图像scipy misc toimage 在此之前我想将图像倾斜给定角度像这样进行插值scipy ndimage interpolation rotate 上图只是为了说明倾斜过程我知道我必须
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
我可以在pycharm中的断点处进入交互模式吗

我是一个相当新的 Pycharm 3 用户正在从事 django 项目我可以在 pycharm3 中的断点处进入交互模式吗这可能吗当程序在断点处停止时我尝试过工具 gt 打开调试命令行但我没有看到控制台打开我怎样才能让它发挥作
如何在 Django 中像应用程序一样从配置中注册 Flask 蓝图？

如何从我的配置中注册 Flask 蓝图就像 Django 中的应用程序一样我想在配置文件中定义蓝图它将自动注册 config py BLUEPRINTS news files 实际上我一直在一个暂定名为的项目中勾勒出类似的东西臀部口袋
NumPy 根据另一个数组中的值对第三个数组中的每个匹配元素求和一个数组

我有两个 numpy 数组一个包含值另一个包含每个值类别 values np array 1 2 3 4 5 6 7 8 9 10 valcats np array 101 301 201 201 102 302 302 202 102
如何在 FastAPI Swagger API 中按方法类型对方法进行排序？

如何在 FastAPI Swagger 自动文档中设置 API 方法的排序顺序我希望所有方法按类型分组 GET POST PUT DELETE 这个答案 https stackoverflow com questions 24951268
如果任何单元测试失败，如何使 Python 的覆盖率工具失败？

我想使用 shell 脚本来确保我的单元测试通过and我的代码有足够的测试覆盖率我只想运行我的测试代码once 我希望我可以通过coverage https coverage readthedocs io 工具和单次运行的工具如果一项或
如何在 Python 中连接两个列表？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动如何在 Python 中连接两个列表 Example listone 1 2 3 lis
获取列的 [0, x] 元素的最小值

我需要计算一列其中值是对其他列进行矢量化运算的结果 df new col df col1 min 0 df col2 然而事实证明我不能像上面的语法一样使用 min 那么获得 pandas 列的零和给定值之间的最小值的正确方法是什么
如何单独捕获这些异常？

我正在编写一个与 Quickbooks 交互的 Python 程序连接到 Quickbooks 时根据问题的不同我可能会遇到以下两个常见异常之一 pywintypes com error 2147352567 Exception oc
检查图像中是否有太薄的区域

我正在尝试验证雕刻机的黑白图像更多的是剪贴画图像不是照片我需要考虑的主要事情之一是区域的大小或线条的宽度因为机器无法处理太细的线条所以我需要找到比给定阈值更细的区域以此图为例竖琴的琴弦可能太细而无法雕刻我正在阅读有关 Ma
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
我可以以某种方式“编译”一个Python脚本以在没有安装Python的PC上运行吗？

所以我有一个Python脚本 myscript py 我是这样执行的 python D myscript py 但是我必须安装 Python 并将其包含在PATH使其工作的环境变量是否有可能以某种方式将 Python 可执行文件与 Py

随机推荐

如何在多台远程机器上使用 docker swarm 设置多主机网络

在问这个问题之前我已经阅读了很多文章和 stackoverflow 问题但我无法获得适合我的设置的正确答案也许它已经得到解答这是我一直在努力让它发挥作用的架构我有三台物理机我想设置具有多主机网络的 Docker swarm 以便
当 void 运算符的计算结果始终为 undefined 时，为什么它会调用 GetValue(expr)？

JavaScript 中的 void 运算符 http ecma262 5 com ELS5 Section 11 htm Section 11 4 2将调用内部GetValue expr 但总是返回undefined 无论值或表达式是什么
当 UISlider 成为 UIView 其他 self.view 的子视图时，它不会工作

当我将滑块添加为除 self view 之外的任何视图的子视图时它不起作用不滑动但当它是 self view 的子视图时它工作正常您可以在 self view 之外的其他视图上看到它但它不起作用这是我的代码 alphaSlid
将服务器端渲染添加到 create-react-app

我正在研究 create react app 和 SSR 我在这个 repo 中添加了 redux 和 react router gt https github com sarovin StarteKit https github com
无法使用 hist() 函数对齐日期时间对象直方图中的分箱

所以我试图绘制一些日期时间对象的直方图但我永远无法让垃圾箱与条形图对齐我的代码如下我首先导入我的内容并声明开始结束和一天对象 import datetime import matplotlib pyplot as plt end d
按距离对邮政编码邻近搜索进行排序（php/mysql）

我有一个表用户邮政编码其中包含用户的邮政编码纬度和经度我在 stackoverflow 上找到了一个函数可以查找特定半径内的邮政编码 function zipcodeRadius lat lon radius global mys
(_hidden#919_:0) 崩溃符号文件内

我正在尝试手动符号化崩溃日志因为 Xcode 7 不会为我做这件事然而我得出了这个结果这是什么意思我能用它做什么我也使用过atos 它只是给了我相同的地址我确信我有正确的 dSYM app 和日志 Thanks When yo
是什么破坏了 .net 二进制 (dll) 接口

考虑两个 net dll 首先 application dll 包含主要业务逻辑和数据访问代码第二个 webservice dll 主要由 WebMethod 组成这些 WebMethod 链接到 application dll 的对象
如何在 rmarkdown 中格式化 sessionInfo() ？

如果我想在 R 中很好地打印 PDF 中的 sessionInfo 我可以使用 toLatex sessionInfo 似乎应该有一个类似的选项让 rmarkdown 在 HTML 中呈现但我在这里或 Rdocumentation 上找不
如何在android中制作水平滚动视图

我想做这种水平滚动看图片 gt gt gt gt XML 文件保存在 res layout main xml 我的 main xml 文件有错误吗我想用
如何在没有 root 权限的情况下创建多分区 SD 磁盘映像？

是否可以在没有 root 权限即无环回挂载的情况下在 linux 中创建完整的 SD 映像我正在寻找一种自动化嵌入式系统映像创建的方法该映像应包含特定的分区结构以及格式化为 FAT 和 ext2 的分区并填充来自构建系统的文件最
表达式“b=(b-x)&x”是什么意思？

假设 x 是一个集合以下代码将遍历集合 x 的子集 int b 0 do process subset b while b b x x 我读到了有关位操作及其如何用于表示集合的读物表达什么意思b b x x意思是它是如何工作的我熟悉
WPF TreeView ObservableCollection 通知示例代码

我正在尝试编写一个 C WPF 应用程序但我被 TreeView 和 ObservableCollection 困住了这是我的 TreeView 项目 Root SubItem SubItem Root SubItem SubItem
React：动态导入jsx

这个问题与将 JSX 文件动态导入 React 相关基本上我们有一个主要组件它根据数据库中存储的结构动态呈现其他组件动态组件存储在子目录 Components 中我们静态地将 this 定义为 import CompA from
通过处理 NC_HITTEST 移动控件时设置 SizeAll 光标

我写了WndProc可移动控件的方法如下 protected override void WndProc ref Message m const int WM NCHITTEST 0x0084 if m Msg WM NCHITTEST b
ios::noreplace 的 C++ 替换

我正在使用 fstream 打开文件进行写入我不想覆盖现有文件因此经过一番搜索后我发现了 ios noreplace 但是当我编译这个时 include
sklearn“管道实例尚未安装。”错误，尽管它是

已经提出了类似的问题但答案并没有帮助我解决我的问题即使整个管道都安装了管道中的 Sklearn 组件也没有安装 https stackoverflow com questions 58704347 sklearn components
雄辩的 MYSQL 语句：WHERE NOT(A OR B)

我正在开发日期范围重叠功能可以用 13 个正条件编写该功能来检查日期间隔是否重叠 https en wikipedia org wiki Allen 27s interval algebra https en wikipedia org
播放音频并单击重新启动

我正在寻找在 HTML5 音频播放器中重新启动音频文件我定义了一个音频文件和一个play button
Python 中的自动 ARIMA 导致趋势拟合预测不佳

ARIMA 新手尝试使用自动 ARIMA 在 Python 中对数据集进行建模我正在使用 auto ARIMA 因为我相信它会更好地定义 p d 和 q 的值但结果很差我需要一些指导请参阅下面我的可重复尝试尝试如下 DEPEND

Python 中的自动 ARIMA 导致趋势拟合预测不佳

Python 中的自动 ARIMA 导致趋势拟合预测不佳 的相关文章

随机推荐

热门标签

Python 中的自动 ARIMA 导致趋势拟合预测不佳的相关文章