PyTorch搭建LSTM实现时间序列预测（负荷预测）

2023-11-06

I. 前言

在上一篇文章深入理解PyTorch中LSTM的输入和输出（从input输入到Linear输出）中，我详细地解释了如何利用PyTorch来搭建一个LSTM模型，本篇文章的主要目的是搭建一个LSTM模型用于时间序列预测。

系列文章：

II. 数据处理

数据集为某个地区某段时间内的电力负荷数据，除了负荷以外，还包括温度、湿度等信息。

本篇文章暂时不考虑其它变量，只考虑用历史负荷来预测未来负荷。本文中，我们根据前24个时刻的负荷下一时刻的负荷。有关多变量预测请参考：PyTorch搭建LSTM实现多变量时间序列预测（负荷预测）。

def load_data(file_name):
    df = pd.read_csv('data/new_data/' + file_name, encoding='gbk')
    columns = df.columns
    df.fillna(df.mean(), inplace=True)
    return df


class MyDataset(Dataset):
    def __init__(self, data):
        self.data = data

    def __getitem__(self, item):
        return self.data[item]

    def __len__(self):
        return len(self.data)
    
    
def nn_seq_us(B):
    print('data processing...')
    dataset = load_data()
    # split
    train = dataset[:int(len(dataset) * 0.6)]
    val = dataset[int(len(dataset) * 0.6):int(len(dataset) * 0.8)]
    test = dataset[int(len(dataset) * 0.8):len(dataset)]
    m, n = np.max(train[train.columns[1]]), np.min(train[train.columns[1]])

    def process(data, batch_size, shuffle):
        load = data[data.columns[1]]
        load = load.tolist()
        data = data.values.tolist()
        load = (load - n) / (m - n)
        seq = []
        for i in range(len(data) - 24):
            train_seq = []
            train_label = []
            for j in range(i, i + 24):
                x = [load[j]]
                train_seq.append(x)
            # for c in range(2, 8):
            #     train_seq.append(data[i + 24][c])
            train_label.append(load[i + 24])
            train_seq = torch.FloatTensor(train_seq)
            train_label = torch.FloatTensor(train_label).view(-1)
            seq.append((train_seq, train_label))

        # print(seq[-1])
        seq = MyDataset(seq)
        seq = DataLoader(dataset=seq, batch_size=batch_size, shuffle=shuffle, num_workers=0, drop_last=True)

        return seq

    Dtr = process(train, B, True)
    Val = process(val, B, True)
    Dte = process(test, B, False)

    return Dtr, Val, Dte, m, n

上面代码用了DataLoader来对原始数据进行处理，最终得到了batch_size=B的数据集Dtr、Val以及Dte，Dtr为训练集，Val为验证集，Dte为测试集。

III. LSTM模型

这里采用了深入理解PyTorch中LSTM的输入和输出（从input输入到Linear输出）中的模型：

class LSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, output_size, batch_size):
        super().__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.output_size = output_size
        self.num_directions = 1 # 单向LSTM
        self.batch_size = batch_size
        self.lstm = nn.LSTM(self.input_size, self.hidden_size, self.num_layers, batch_first=True)
        self.linear = nn.Linear(self.hidden_size, self.output_size)

    def forward(self, input_seq):
        batch_size, seq_len = input_seq.shape[0], input_seq.shape[1]
        h_0 = torch.randn(self.num_directions * self.num_layers, self.batch_size, self.hidden_size).to(device)
        c_0 = torch.randn(self.num_directions * self.num_layers, self.batch_size, self.hidden_size).to(device)
        # output(batch_size, seq_len, num_directions * hidden_size)
        output, _ = self.lstm(input_seq, (h_0, c_0)) # output(5, 30, 64)
        pred = self.linear(output)  # (5, 30, 1)
        pred = pred[:, -1, :]  # (5, 1)
        return pred

IV. 训练

def train(args, Dtr, Val, path):
    input_size, hidden_size, num_layers = args.input_size, args.hidden_size, args.num_layers
    output_size = args.output_size
    if args.bidirectional:
        model = BiLSTM(input_size, hidden_size, num_layers, output_size, batch_size=args.batch_size).to(device)
    else:
        model = LSTM(input_size, hidden_size, num_layers, output_size, batch_size=args.batch_size).to(device)

    loss_function = nn.MSELoss().to(device)
    if args.optimizer == 'adam':
        optimizer = torch.optim.Adam(model.parameters(), lr=args.lr,
                                     weight_decay=args.weight_decay)
    else:
        optimizer = torch.optim.SGD(model.parameters(), lr=args.lr,
                                    momentum=0.9, weight_decay=args.weight_decay)
    scheduler = StepLR(optimizer, step_size=args.step_size, gamma=args.gamma)
    # training
    min_epochs = 10
    best_model = None
    min_val_loss = 5
    for epoch in tqdm(range(args.epochs)):
        train_loss = []
        for (seq, label) in Dtr:
            seq = seq.to(device)
            label = label.to(device)
            y_pred = model(seq)
            loss = loss_function(y_pred, label)
            train_loss.append(loss.item())
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

        scheduler.step()
        # validation
        val_loss = get_val_loss(args, model, Val)
        if epoch > min_epochs and val_loss < min_val_loss:
            min_val_loss = val_loss
            best_model = copy.deepcopy(model)

        print('epoch {:03d} train_loss {:.8f} val_loss {:.8f}'.format(epoch, np.mean(train_loss), val_loss))
        model.train()

    state = {'models': best_model.state_dict()}
    torch.save(state, path)

保存训练过程中在验证集上表现最好的模型。

V. 测试

def test(args, Dte, path, m, n):
    pred = []
    y = []
    print('loading models...')
    input_size, hidden_size, num_layers = args.input_size, args.hidden_size, args.num_layers
    output_size = args.output_size
    if args.bidirectional:
        model = BiLSTM(input_size, hidden_size, num_layers, output_size, batch_size=args.batch_size).to(device)
    else:
        model = LSTM(input_size, hidden_size, num_layers, output_size, batch_size=args.batch_size).to(device)
    # models = LSTM(input_size, hidden_size, num_layers, output_size, batch_size=args.batch_size).to(device)
    model.load_state_dict(torch.load(path)['models'])
    model.eval()
    print('predicting...')
    for (seq, target) in tqdm(Dte):
        target = list(chain.from_iterable(target.data.tolist()))
        y.extend(target)
        seq = seq.to(device)
        with torch.no_grad():
            y_pred = model(seq)
            y_pred = list(chain.from_iterable(y_pred.data.tolist()))
            pred.extend(y_pred)

    y, pred = np.array(y), np.array(pred)
    y = (m - n) * y + n
    pred = (m - n) * pred + n
    print('mape:', get_mape(y, pred))
    # plot
    x = [i for i in range(1, 151)]
    x_smooth = np.linspace(np.min(x), np.max(x), 900)
    y_smooth = make_interp_spline(x, y[150:300])(x_smooth)
    plt.plot(x_smooth, y_smooth, c='green', marker='*', ms=1, alpha=0.75, label='true')

    y_smooth = make_interp_spline(x, pred[150:300])(x_smooth)
    plt.plot(x_smooth, y_smooth, c='red', marker='o', ms=1, alpha=0.75, label='pred')
    plt.grid(axis='y')
    plt.legend()
    plt.show()

简单训练30轮，MAPE为5.77%：
在这里插入图片描述

VI. 源码及数据

暂无。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

DL

时间序列预测

LSTM

PyTorch搭建LSTM实现时间序列预测（负荷预测）的相关文章

为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
Keras：嵌入 LSTM

在 LSTM 的 keras 示例中用于对 IMDB 序列数据进行建模 https github com fchollet keras blob master examples imdb lstm py https github com
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境

随机推荐

解决pycharm安装好后打不开的问题

你最近应该把带有Visual C 字样的东西卸载了吧把 Visual C 安装回来就OK了安装网址 https support microsoft com zh cn help 2977003 the latest supported
树莓派4B下opencv3.4.0的安装测试与所有错误处理

1 opencv3 4 0的下载可以在树莓派的终端界面通过wegt命令下载但下载速度可能很慢终端输入下列代码进行下载 cd home pi Downloads wget https github com Itseez opencv a
Erlang数据类型的表示和实现（5）——binary

binary 是 Erlang 中一个具有特色的数据结构用于处理大块的原始的字节块如果没有 binary 这种数据类型在 Erlang 中处理字节流的话可能还需要像列表或元组这样的数据结构根据之前对这些数据结构 Eterm 的描
VI/VIM 键盘图及常规快捷操作

一 VI VIM 键盘图二模式转换 2 1 一般模式 2 2 编辑模式 2 3 命令模式
EasyExcel导出图片到Excel

EasyExcel导出图片到Excel 需要自己重新写转换器但是1000张以下导出是没问题的 10000以上会卡顿有意向的小伙伴可以一起讨论下如何处理大数量的图片导出到excel import com alibaba excel co
GCC详解-总览

1 GCC是什么早期 GCC 的全拼为 GNU C Compiler 即 GUN 计划诞生的 C 语言编译器显然最初 GCC 的定位确实只用于编译 C 语言但经过这些年不断的迭代 GCC 的功能得到了很大的扩展它不仅可以用来编译 C
数字IC设计学习笔记_静态时序分析STA_配置STA环境2

数字IC设计学习笔记配置STA环境2 1 约束 Input path 和 Output path 2 时序路径组Timing path groups 3 外部属性建模 1 约束 Input path 和 Output path 约束 In
【华为OD机试真题 python】识图谱新词挖掘【2023 Q1

题目描述识图谱新词挖掘小华负责公司知识图谱产品现在要通过新词挖掘完善知识图谱新词挖掘给出一个待挖掘文本内容字符串Content和一个词的字符串word 找到content中所有word的新词新词使用词word的字符排列形成的字
ES6入门：iterator迭代器

迭代模式 ES6迭代器标准化接口迭代循环自定义迭代器迭代器消耗一迭代模式迭代模式中通常有一个包含某种数据集合的对象该数据可能存在一个复杂数据结构内部而要提供一种简单的方法能够访问数据结构中每个元素对象消费者并不需要知道如
二、redis中String和List两种数据类型和应用场景

导读前面文章一深入理解redis之需要掌握的知识点中我们对redis需要学习的内容进行了一个梳理从本篇文章开始我们将要对redis中各个知识点做详细的学习和分析本篇文章我们学习的是redis中基础数据类型String和Lis
matlab如何求矩阵特征值

根据线性代数理论特征值与特征向量只存在于方阵如下所示为一方阵A 在matlab输入矩阵 A 1 2 4 4 0 7 9 1 3 查阅matlab help可以知道利用eig函数可以快速求解矩阵的特征值与特征向量格式 V D eig
【踩坑】AES256解密失败，jasypt解密失败最简单解决办法(本地环境)

背景最近被拉去一个新项目组他们用的jasypt加密方式为数据库信息加密我拉取代码后一跑果然报错了 Unable to decrypt ENC xxxx 在试了n中方法包括创建新项目使用jasypt复现写demo直接用jasyp
给你们讲个笑话——低代码会取代程序员

今天是正经男我们严肃讨论一下一直以来争吵不休的取代问题低代码开发平台低代码技术会取代开发人员么一背景低代码开发平台的普及让很多公司对快速生成应用抱有很大期望甚至有人认为低代码开发平台未来会干掉开发者这是真的吗好久没
压缩感知入门

学习资料网站http dsp rice edu cs 具有相关大量详细介绍的论文
idea 编译和构建 Java Web 项目后，没有生成 target 文件夹，且生成的 out 文件夹中没有 class 文件

问题在用 idea 编译和构建 Java Web 项目的时候项目的目录中没有 target文件夹生成的 out 文件夹中没有 class 文件办法出现这种情况很可能是因为未加载的模块出现在了 iml 文件中导致生成 tage
Unity Animation -- 导入动画

尽管Unity中的动画工具已经比较强大了但对于非常复杂的或很长的动画通常是由外部DCC创建特别是对于角色动画来说需要在动画过程中进行复杂的控制因此我们通常需要将外部制作的动画导入到Unity中动画能被共享吗对于复杂的动画制作
阿里云-对象存储OSS

大家好我是码赛客1024 今天我们一起来学习阿里云的对象存储服务OSS 一介绍阿里云对象存储OSS Object Storage Service 是一款海量安全低成本高可靠的云存储服务提供99 9999999999 12个9
树的高度和深度

用到树的数据结构时经常会考虑树的高度和深度但是lz总是搞混了总虽然比较简单就是个定义记住就行了但是因为长时间总是弄错所以写一篇博文加深一下印象 1 树的深度树的深度可以这样理解计算一个节点的深度从根节点算起记住从1开
LeetCode 之 Search for a Range

题目链接 Search for a Range 对于一个按照升序排序的整数数组找到给定目标值的开始位置和结束位置且时间复杂度为O log n 如果在数组中找不到目标值则返回 1 1 例如数组为 5 7 7 8 8 10 和目标值8
PyTorch搭建LSTM实现时间序列预测（负荷预测）

目录 I 前言 II 数据处理 III LSTM模型 IV 训练 V 测试 VI 源码及数据 I 前言在上一篇文章深入理解PyTorch中LSTM的输入和输出从input输入到Linear输出中我详细地解释了如何利用PyTorch来