线性回归、Arima和LSTM做单特征预测

2023-11-10

一、数据集展示

1.本文只针对单特征的时间序列，这里分别只有时间和牛肉批发价两个特征，一共是三百多条数据

二、模型

1.线性回归

任务：只以当前的牛肉批发价作为特征，预测过后5天的牛肉批发价

（1）线性回归需要有x和y两个维度，这里将原本的牛肉批发价作为x，将第五天开始到最后一天的牛肉批发价作为y，进行训练。

（2）划分训练集和测试集

X_train, X_test，y_train, y_test

对训练集进行fit，最后使用predict 对测试集进行测试，得到y_pred，最后进行预测的后五天与以前的综合在一块，进行比较。

（3）代码

import pandas as pd
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

data = pd.read_csv(r'C:\Users\独为我唱\Desktop\archive\rice_beef_coffee_price_changes.csv')

# 提取特征和目标变量
X = data['Price_beef_kilo'].values.reshape(-1, 1)  # 牛肉批发价作为特征，转换成二维数组
y = data['Price_beef_kilo'].shift(-5).dropna().values.reshape(-1, 1)  # 预测过后5天的牛肉批发价作为目标变量，转换成二维数组

# 划分训练集和测试集
train_size = int(len(X) * 0.8)  # 80%作为训练集
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]

# 训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)

# 在测试集上进行预测并评估模型性能
y_pred = model.predict(X_test)  # 360, 1

y_test_1 = np.delete(X_test, range(60,72), axis=0)
y_pred_1 = np.delete(y_pred, range(0,60), axis=0)
y_test_pred = np.concatenate((y_test_1, y_pred_1), axis=0)


# 绘制折线图
plt.rcParams['font.sans-serif']=['SimHei']
plt.plot(X_test, label='Actual Price')  # 绘制实际价格折线图
plt.plot(y_test_pred, label='Predicted Price')  # 绘制预测价格折线图
plt.legend()
plt.title('价格预测')
plt.xlabel('商品时间顺序')
plt.ylabel('牛肉价格')
plt.show()

（4）结果图

2.LSTM

任务：以rice价格和coffee价格为特征

代码：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout

df = pd.read_csv(r'C:\Users\独为我唱\Desktop\archive\rice_beef_coffee_price_changes.csv')
df = df[['Year', 'Price_beef_kilo', 'Price_rice_kilo', 'Price_coffee_kilo']]

# 将日期转换为时间戳，并将其设置为索引
df['date'] = pd.to_datetime(df['Year'])
df.set_index('date', inplace=True)

# 创建特征矩阵和目标向量
X = df[['Price_beef_kilo', 'Price_rice_kilo']].values
y = df[['Price_coffee_kilo']].values

# 对数据进行归一化处理
scaler = MinMaxScaler(feature_range=(0, 1))
X = scaler.fit_transform(X)
y = scaler.fit_transform(y)

# 分割数据集为训练集和测试集
train_size = int(len(X) * 0.8)
test_size = len(X) - train_size

X_train, X_test = X[0:train_size,:], X[train_size:len(X),:]
y_train, y_test = y[0:train_size,:], y[train_size:len(X),:]

print("分割数据集为训练集和测试集成功！")

# 将数据集转换为适合LSTM模型的形状 [样本数，时间步数，特征数]
def create_dataset(X, y, time_steps=1):
    Xs, ys = [], []
    for i in range(len(X) - time_steps):
        v = X[i:(i + time_steps)]
        Xs.append(v)
        ys.append(y[i + time_steps])
    return np.array(Xs), np.array(ys)

time_steps = 18

X_train, y_train = create_dataset(X_train, y_train, time_steps)
X_test, y_test = create_dataset(X_test, y_test, time_steps)

# 打印数据集的形状
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)

# 定义LSTM模型
model = Sequential()
model.add(LSTM(units=64, input_shape=(time_steps, 2)))
model.add(Dropout(0.5))
model.add(Dense(units=1))
model.compile(optimizer='adam', loss='mean_squared_error')

# 训练模型
model.fit(X_train, y_train, epochs=50, batch_size=16)

# 进行预测
y_pred = model.predict(X_test)

# 将归一化的预测结果反转回原始值
y_test = scaler.inverse_transform(y_test)
y_pred = scaler.inverse_transform(y_pred)

# 预测
y_test_1 = np.delete(y_test, range(42,54), axis=0)
y_pred_1 = np.delete(y_pred, range(0,42), axis=0)
y_test_shiji = np.concatenate((y_test_1, y_pred_1), axis=0)

# 绘制原始结果和预测结果的对比图
plt.rcParams['font.sans-serif']=['SimHei']
plt.plot(y_test, label='Actual Price')
plt.plot(y_test_shiji, label='Predicted Price')
plt.legend()
plt.title('价格预测')
plt.xlabel('商品时间顺序')
plt.ylabel('牛肉价格')
plt.savefig('C:\\Users\\独为我唱\\Desktop\\archive\\lstm_model_1.pdf', bbox_inches='tight' )
plt.show()

结果图：

三、Arima自适应回归

任务：只利用牛肉批发价这一个特征进行预测

代码：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.arima.model import ARIMA

# 读取数据
df = pd.read_csv(r'C:\Users\独为我唱\Desktop\archive\rice_beef_coffee_price_changes.csv')
data = df['Price_beef_kilo'].values

# 拆分训练集和测试集
train_size = int(len(data) * 0.67)
train_data, test_data = data[:train_size], data[train_size:]

# 构建ARIMA模型
p, d, q = 3, 1, 0  # 选择ARIMA的参数
model = ARIMA(train_data, order=(p, d, q))
model_fit = model.fit()

# 进行预测
forecast = model_fit.forecast(steps=len(test_data))

#拼接， 展示时分别展示原始的牛肉价格和包含了对最后十天预测的牛肉价格
y_test_1 = np.delete(test_data, range(60,72), axis=0)
y_pred_1 = np.delete(forecast, range(0,60), axis=0)
y_test_pred = np.concatenate((y_test_1, y_pred_1), axis=0)

test_data = np.delete(test_data, range(75,119), axis=0)
y_test_pred = np.delete(y_test_pred, range(75,166), axis=0)
# 绘制原始结果和预测结果的对比图
plt.rcParams['font.sans-serif']=['SimHei']
plt.plot(test_data, label='Actual Price')
plt.plot(y_test_pred, label='Predicted Price')
plt.legend()
plt.title('价格预测')
plt.xlabel('商品时间顺序')
plt.ylabel('牛肉价格')
plt.show()

结果图：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络

线性回归

LSTM

机器学习

线性回归、Arima和LSTM做单特征预测的相关文章

基于机器学习的贷中风险预测模型-江苏银行“随e融”杯-二等奖

文章目录源码下载地址项目介绍界面预览项目备注毕设定制咨询源码下载地址源码下载地址点击这里下载源码项目介绍基于机器学习的贷中风险预测模型江苏银行
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
机器学习算法实战案例：LSTM实现多变量多步负荷预测

文章目录 1 数据处理 1 1 数据集简介 1 2 数据集处理 2 模型训练与预测 2
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
如何处理极长的LSTM序列长度？

我有一些数据以非常高的速率大约每秒数百次采样对于任何给定实例这会导致平均序列长度很大约 90 000 个样本整个序列有一个标签我正在尝试使用 LSTM 神经网络将新序列分类为这些标签之一多类分类然而使用具有如此大序列长度
TfLite LSTM 模型

我还没有找到任何可以使用的预训练 lstm 模型 tfLite 是否提供了任何预训练的 lstm 模型我尝试创建 tflite 模型但在转换时遇到问题您能提供创建 tfLite 模型的确切脚本吗 tfLite 是否有任何用于创建最新版
Keras LSTM：检查模型输入维度时出错

我是 keras 的新用户正在尝试实现 LSTM 模型为了测试我声明了如下所示的模型但由于输入维度的差异而失败虽然我在这个网站上发现了类似的问题但我自己无法发现我的错误 ValueError Error when checkin
Python - 基于 LSTM 的 RNN 需要 3D 输入？

我正在尝试构建一个基于 LSTM RNN 的深度学习网络这是尝试过的 from keras models import Sequential from keras layers import Dense Dropout Activatio
无法挤压 dim[1]，预期维度为 1，得到 499

我正在尝试制作一个自动编码器但遇到了上述错误查看 Stack Exchange 上的其他帖子并没有帮助这是完整的错误 InvalidArgumentError Can not squeeze dim 1 expected a dime
在 Tensorflow 中检索 LSTM 序列的最后一个值

我有不同长度的序列想在 Tensorflow 中使用 LSTM 进行分类对于分类我只需要每个序列最后一个时间步长的 LSTM 输出 max length 10 n dims 2 layer units 5 input tf place
如何为 keras lstm 输入重塑数据？

我是 Keras 新手我发现很难理解 LSTM 层输入数据的形状 Keras 文档表示输入数据应该是形状为 nb samples timesteps input dim 的 3D 张量我有808信号每个信号有22个通道和2000个数据
将静态数据（不随时间变化）添加到 LSTM 中的序列数据

我正在尝试建立一个如下图所示的模型请看下图我想在 LSTM 层中传递序列数据在另一个前馈神经网络层中传递静态数据血型性别后来我想将它们合并然而我对这里的维度感到困惑如果我的理解是正确的如图所示 5维序列数据如何与4维静态
Tensorflow动态RNN（LSTM）：如何格式化输入？

我已获得这种格式的一些数据以及以下详细信息 person1 day1 feature1 feature2 featureN label person1 day2 feature1 feature2 featureN label person
张量流 LSTM 模型中的 NaN 损失

以下网络代码应该是经典的简单 LSTM 语言模型一段时间后开始输出 nan 损失在我的训练集上这需要几个小时而且我无法在较小的数据集上轻松复制它但在认真的训练中这种情况总是会发生 Sparse softmax with cros
Keras：嵌入 LSTM

在 LSTM 的 keras 示例中用于对 IMDB 序列数据进行建模 https github com fchollet keras blob master examples imdb lstm py https github com
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
Keras LSTM 密集层多维输入

我正在尝试创建一个 keras LSTM 来预测时间序列我的 x train 形状像 3000 15 10 示例时间步长特征 y train 形状像 3000 15 1 我正在尝试构建一个多对多模型每个序列 10 个输入特征产生 1
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形

随机推荐

Java—斗地主的洗牌发牌系统（积小流成江海）

不爱生姜不吃醋原创不易转载请注明原链接前序文章 Java基础学籍管理系统文章目录一斗地主 1 前言 2 介绍 3 图解二准备牌 1 代码示例 2 数据展示三洗发牌与排序代码示例四看牌打印到控制台 1 代码示例
【操作系统知识】段页式存储管理

本文转载地址 https blog csdn net shuxnhs article details 80789570 分页与分段的区别 1 页是信息的物理单位是系统管理的需要而不是用户的需要而段是信息的逻辑单位分段是为了更好地满足用
Node.js 全网最详细教程 (第一章：Node学习入门必看教程)

1 Node的学前必知 1 在学习node之前想必你应该学习过HTML CSS JavaScript 2 浏览器中的JavaScript由两部分组成 JS核心语法和WebAPI JS核心语法 WebAPI 变量数据类型 DOM操作循环
大数据概念及应用

1 1 大数据的概念与意义 1 从数据到大数据时至今日数据变身大数据开启了一次重大的时代转型大数据这一概念的形成有三个标志性事件 2008年9 月美国自然 Nature 杂志专刊 The next google 第
Caffe源码中common文件分析

Caffe源码 caffe version 09868ac date 2015 08 15 中的一些重要头文件如caffe hpp blob hpp等或者外部调用Caffe库使用时一般都会include
僵尸进程与孤儿进程，以及如何查看僵尸进程

转载来自什么是僵尸进程与孤儿进程张维鹏的博客 CSDN博客 1 什么是僵尸进程和孤儿进程在 Unix Linux 系统中正常情况下子进程是通过父进程创建的且两者的运行是相互独立的父进程永远无法预测子进程到底什么时候结束当一个
阿里云服务器华东地域杭州和上海有什么区别？

阿里云服务器华东1和华东2有什么区别华东1和华东2都是指云服务器地域什么是地域地域是指云服务器所在数据中心的地理位置华东1在杭州华东2在上海区别在于地区位置不同华东1和华东2国内均为BGP多线高速网络网络质量方面是没有区别的
于仕琪老师新版本人脸识别 - DLL接口及Python语言案例

于老师人脸识别的新版本于老师开源了他著名的人脸识别的新版本参见 https github com ShiqiYu libfacedetection 经过测试对比新旧版本发现 1 新版本可以识别任意角度的面孔包括倒立的这一点是
记录一次Springboot的错误

Springboot前端传值和后端接受的值不一直错误描述解决方案粗心大意呀错误描述用 RequestBody 接受一个对象对象中id字段用的是Long类型解决方案在json中Long类型是当作String类型来传递的粗心大
【每周一本书】之《消费金融真经》：个人贷款业务全流程指南

数据猿导读数据驱动是贯穿本书的核心理念五大原则是管理消费金融业务的精髓编辑 abby 官网 www datayuan cn 微信公众号ID datayuancn 金融的本质是不同主体之间通
今年软件测试好找工作吗？传言说行业人才饱和是真的吗？

先说结论软件测试好找工作人才缺口依然十分巨大人才饱和是假的不管是软件测试还是开发行业饱和这个事真的是年年都有人念叨就好像年年高考都有个什么刘明伟白雅倩丢准考证一样骗的都是老实人什么是饱和就是人才数量大于市场需求那也就意
Win10和Ubuntu20.04双系统安装教程详解

一准备材料 U盘容量 gt 16G 刻录软件 UltraISO Ubuntu 20 04镜像文件二查看电脑的信息查看BIOS模式 win r 快捷键进入运行输入 msinfo32 回车出现以下界面可查看BIOS模式 UEF
一种web服务器前后台关联审计方法及系统,一种基于多层业务关联的数据库审计方法及系统...

1 一种基于多层业务关联的数据库审计方法其特征在于所述数据库审计方法包括以下步骤通过机器学习形成数据库审计结果中的结构化查询语言 Structured QueryLanguage SQL 参数及其用户网络 WEB 的统一资源定位符 U
linux操作系统lVM扩容

在CentOS中 LVM 逻辑卷管理器是一种用于管理磁盘空间的工具它将多个物理卷如硬盘 SSD等组合成一个或多个逻辑卷并且可以根据需要动态地调整它们的大小当我们的存储需求不断增长时可能会遇到磁盘空间不足的问题此时我们可以扩
C#系列之ArrayList

C 最核心的部分已经学习结束了接下来我们将学习一些进阶知识点学习完这些能够让你的程序更加完美目录 1 ArrayList的本质 2 声明 3 增删查改 4 遍历 5 装箱拆箱 1 ArrayList的本质 ArrayList是C 为我
Yii2安装遇到Loading composer repositories with package information

模仿yii2官网使用下面的指令 composer create project prefer dist yiisoft yii2 app basic basic 然后项目卡在这个地方超时之后开始报下面的错误 curl error 28 w
字符编码的常用种类介绍

字符编码的常用种类介绍第一种 ASCII码 ASCII American Standard Code for Information Interchange 美国信息交换标准代码是基于拉丁字母的一套电脑编码系统主要用于显示现代英语和其
QT .pro文件详解

QT 指定工程中使用的Qt的模块默认情况下会使用Qt 的core和gui模块 QT core gui 基础模块简介 https www cnblogs com lvdongjie p 4809319 html TARGET 指定所生成 e
vue实现用户点击按钮右侧滑动页面

1 需求说明移动端开发中用户点击标签元素实现右侧滑出页面 2 效果图 3 源码实现
线性回归、Arima和LSTM做单特征预测

一数据集展示 1 本文只针对单特征的时间序列这里分别只有时间和牛肉批发价两个特征一共是三百多条数据二模型 1 线性回归任务只以当前的牛肉批发价作为特征预测过后5天的牛肉批发价 1 线性回归需要有x和y两个维度这里将原本的牛

线性回归、Arima和LSTM做单特征预测

一、数据集展示

二、模型

线性回归、Arima和LSTM做单特征预测 的相关文章

随机推荐

热门标签

线性回归、Arima和LSTM做单特征预测的相关文章