用于多元时间序列的 Keras 递归神经网络

2023-12-05

我一直在阅读有关 Keras RNN 模型（LSTM 和 GRU）的内容，作者似乎主要关注语言数据或使用由先前时间步骤组成的训练实例的单变量时间序列。我的数据有点不同。

我在 10 年里每年测量 100,000 人的 20 个变量作为输入数据，并将第 11 年测量的 20 个变量作为输出数据。我想做的是预测第 11 年其中一个变量（而不是其他 19 个）的值。

我的数据结构为X.shape = [persons, years, variables] = [100000, 10, 20] and Y.shape = [persons, variable] = [100000, 1]。下面是我的 LSTM 模型的 Python 代码。

## LSTM model.

# Define model.

network_lstm = models.Sequential()
network_lstm.add(layers.LSTM(128, activation = 'tanh', 
     input_shape = (X.shape[1], X.shape[2])))
network_lstm.add(layers.Dense(1, activation = None))

# Compile model.

network_lstm.compile(optimizer = 'adam', loss = 'mean_squared_error')

# Fit model.

history_lstm = network_lstm.fit(X, Y, epochs = 25, batch_size = 128)

我有四个（相关的）问题，请：

我是否针对我拥有的数据结构正确编码了 Keras 模型？我从全连接网络（使用扁平数据）和 LSTM、GRU 和 1D CNN 模型获得的性能几乎相同，我不知道我是否在 Keras 中犯了错误，或者循环模型是否只是简单在这种情况下没有帮助。
我应该将 Y 作为形状系列吗Y.shape = [persons, years] = [100000, 11]，而不是将变量包含在 X 中，这样它就会具有形状X.shape = [persons, years, variables] = [100000, 10, 19]？如果是这样，如何让 RNN 输出预测序列？当我使用return_sequences = True，Keras 返回错误。
这是利用我所拥有的数据进行预测的最佳方法吗？ Keras RNN 模型甚至其他模型是否有更好的选择？
如何模拟与我所拥有的数据结构类似的数据，以便 RNN 模型的性能优于全连接网络？

UPDATE:

我尝试过模拟，我希望是一个非常简单的情况，其中 RNN 应该优于 FNN。

虽然 LSTM 在隐藏层数较少 (4) 时往往优于 FNN，但在隐藏层数较多 (8+) 时，性能变得相同。有人能想到更好的模拟吗？在这种模拟中，RNN 有望优于具有类似数据结构的 FNN？

from keras import models
from keras import layers

from keras.layers import Dense, LSTM

import numpy as np
import matplotlib.pyplot as plt

下面的代码模拟 10,000 个实例、10 个时间步长和 2 个变量的数据。如果第二个变量在第一个时间步长为 0，则 Y 为最后一个时间步长的第一个变量的值乘以 3。如果第二个变量在第一个时间步长为 1，则 Y 为最后一个时间步的第一个变量的值乘以 9。

我希望 RNN 将第一个时间步长的第二个变量的值保留在内存中，并使用它来知道最后一个时间步长的第一个变量乘以哪个值（3 或 9）。

## Simulate data.

instances = 10000

sequences = 10

X = np.zeros((instances, sequences * 2))

X[:int(instances / 2), 1] = 1

for i in range(instances):

    for j in range(0, sequences * 2, 2):

        X[i, j] = np.random.random()

Y = np.zeros((instances, 1))

for i in range(len(Y)):

    if X[i, 1] == 0:

        Y[i] = X[i, -2] * 3

    if X[i, 1] == 1:

        Y[i] = X[i, -2] * 9

下面是 FNN 的代码：

## Densely connected model.

# Define model.

network_dense = models.Sequential()
network_dense.add(layers.Dense(4, activation = 'relu', 
     input_shape = (X.shape[1],)))
network_dense.add(Dense(1, activation = None))

# Compile model.

network_dense.compile(optimizer = 'rmsprop', loss = 'mean_absolute_error')

# Fit model.

history_dense = network_dense.fit(X, Y, epochs = 100, batch_size = 256, verbose = False)

plt.scatter(Y[X[:, 1] == 0, :], network_dense.predict(X[X[:, 1] == 0, :]), alpha = 0.1)
plt.plot([0, 3], [0, 3], color = 'black', linewidth = 2)
plt.title('FNN, Second Variable has a 0 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

plt.scatter(Y[X[:, 1] == 1, :], network_dense.predict(X[X[:, 1] == 1, :]), alpha = 0.1)
plt.plot([0, 9], [0, 9], color = 'black', linewidth = 2)
plt.title('FNN, Second Variable has a 1 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

下面是 LSTM 的代码：

## Structure X data for LSTM.

X_lstm = X.reshape(X.shape[0], X.shape[1] // 2, 2)

X_lstm.shape

## LSTM model.

# Define model.

network_lstm = models.Sequential()
network_lstm.add(layers.LSTM(4, activation = 'relu', 
     input_shape = (X_lstm.shape[1], 2)))
network_lstm.add(layers.Dense(1, activation = None))

# Compile model.

network_lstm.compile(optimizer = 'rmsprop', loss = 'mean_squared_error')

# Fit model.

history_lstm = network_lstm.fit(X_lstm, Y, epochs = 100, batch_size = 256, verbose = False)

plt.scatter(Y[X[:, 1] == 0, :], network_lstm.predict(X_lstm[X[:, 1] == 0, :]), alpha = 0.1)
plt.plot([0, 3], [0, 3], color = 'black', linewidth = 2)
plt.title('LSTM, FNN, Second Variable has a 0 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

plt.scatter(Y[X[:, 1] == 1, :], network_lstm.predict(X_lstm[X[:, 1] == 1, :]), alpha = 0.1)
plt.plot([0, 9], [0, 9], color = 'black', linewidth = 2)
plt.title('LSTM, FNN, Second Variable has a 1 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

是的，使用的代码对于您正在尝试执行的操作是正确的。 10 年是用于预测下一年的时间窗口，因此这应该是模型中 20 个变量中每个变量的输入数量。 100,000 个观测值的样本量与模型的输入形状无关。
您最初塑造因变量 Y 的方式是正确的。您预测 1 个变量的窗口期为 1 年，并且您有 100,000 个观测值。关键词论证return_sequences=True会导致抛出错误，因为您只有一个 LSTM 层。将此参数设置为True如果您正在实现多个 LSTM 层，并且相关层后面跟着另一个 LSTM 层。

我希望我能为 3 提供一些指导，但在没有实际数据集的情况下，我不知道是否可以肯定地回答这个问题。

我想说的是，LSTM 的设计目的是解决常规 RNN 中存在的长期依赖问题。这个问题归结为，随着观察到相关信息的时间与该信息有用的时间之间的差距越来越大，标准 RNN 将更难学习它们之间的关系。考虑根据 3 天的活动与全年的活动来预测股票价格。

这就引出了第四点。如果我宽松地使用“类似”这个术语，并将时间窗口进一步拉长，比如 50 年而不是 10 年，那么使用 LSTM 获得的优势将变得更加明显。尽管我确信更有经验的人能够提供更好的答案，并且我期待看到它。

我发现此页面有助于理解 LSTM：

https://colah.github.io/posts/2015-08-Understanding-LSTMs/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

用于多元时间序列的 Keras 递归神经网络的相关文章

错误：process_executor.py:702: ... 当一些作业被分配给执行器时，工作人员停止了。这可能是由于工作超时太短造成的

根据主题中的错误修复方法是什么环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
python sys.path 故障排除

python 文档位于http docs python org library sys html http docs python org library sys html比如说sys path is 从环境变量 PYTHONPATH 以及
Python 切片对象和 __getitem__

python 中是否有内部的东西来处理传递给的参数 getitem 不同并自动转换start stop step构造成切片这是我的意思的演示 class ExampleClass object def getitem self args
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的

随机推荐

UITableViewController 以编程方式访问静态单元格问题

假设我有一个包含 10 个静态单元格的表格有没有办法以编程方式选择某个单元格我试过这个 UITableViewCell cell self tableView subviews objectAtIndex indexPath row 但
PHP utf8_encode() 将空格转换为不间断空格[关闭]

Closed 这个问题需要调试细节目前不接受答案非常简单 utf8 encode string 用不间断空格 u00a0 替换常规空格我尝试使用 str replace 过滤结果 str replace u00a0 utf8 enco
C 中的外部链接

K R 说默认情况下外部变量和函数具有以下属性所有以相同名称对它们的引用即使是单独编译的函数也是对同一事物的引用请解释一下这是什么意思我不明白考虑两个函数 extern int extern sqr int i return
java itext 使用希伯来语（rtl）和英语创建pdf

我想创建一个同时包含英语和希伯来语的 pdf 文档我可以使用以下命令查看希伯来语字母 BaseFont unicode BaseFont createFont c windows fonts arialuni ttf BaseFont I
jQuery 可调整大小：将调整宽度加倍

概要如果将可调整大小的元素居中并向左右扩展它会产生一种错觉即它仅扩展了鼠标移动的一半 Reason 发生这种情况是因为对象居中问题与鼠标移动相比如何提高对象调整大小的速率对于居中的元素我希望对象扩展为鼠标距离的两倍给定一
Go 中 Syscall.RawSyscall() 和 Syscall.Syscall() 的详细信息？

我正在阅读包中的源代码syscall现在遇到了一些问题因为我完全是菜鸟syscall and assembly 所以请毫不犹豫地分享您所知道的任何信息首先关于 funcRawSyscall trap a1 a2 a3 uintptr
如何配置maven-bundle-plugin以排除Import-Service和Export-Service？

我使用 maven bundle plugin 创建 OSGi 合规性 jar 它生成预期的 OSGi MANIFEST 导入服务和导出服务除外根据http wiki osgi org wiki Import Service 不推荐使用
默认 updateDateInput 今后不起作用

我有一个简单的应用程序它使用动态 UI 元素 updateDateInput 以确保用户只能选择指定年份中的日期所选日期应始终默认为所选年份的第一天 library shiny library tidyverse library lub
是否可以组合多个选项并传递给 matlab 中的绘图函数

我正在使用 MATLAB 绘制多个图形并希望这些图形使用相同的绘图选项它看起来像这样 N 20 Fs 200 t 0 N 1 Fs x sin 2 pi 10 t y cos 2 pi 20 t z x y figure 1 clf s
正则表达式惰性量词表现得贪婪

我有这样的文字 Some Text 1 Some Text 2 Some Text 3 Some Text 4 我要匹配 Some Text 2 使用这个正则表达式 2 但它返回 Some Text 1 Some Text 2 我怎样才能只
比较两个字符串，strcmp 的问题

我试图检查从 stdin 读取的行是否以 login 开头但 strcmp 似乎不起作用 char s1 20 s2 20 fgets s1 20 stdin strncpy s2 s1 6 strcmp s2 login if strc
计算特殊情况下点到线段的距离

我需要实现以下逻辑给定一组 2d 样本点以 x y 坐标对形式给出和一组线段也是 x y 坐标对编辑1 如何计算矢量化点的距离pi到线条Li 这些点大约靠近线条我想获取每个样本点到最近线段的距离这些点可能有点偏离参见第
cordova ios 中的谷歌地图加载问题

当我第一次使用谷歌地图 URL 打开谷歌地图时如果谷歌地图未在后台运行方向将不会显示如果谷歌地图在后台运行则方向将正确显示我正在 Cordova 上工作在 android 中这个问题不存在但在 iOS 中我遇到了这个问题
为什么 requests.get() 不返回？ requests.get() 使用的默认超时是多少？

在我的剧本中 requests get永不返回 import requests print requesting This call never returns r requests get http www some site examp
Java代码注释中使用方括号的目的是什么？

我看到 Google 的一些 Java 代码在注释中使用了方括号例如 START initialize auth mAuth FirebaseAuth getInstance END initialize auth 这种风格有什么特殊用途
Symfony2 中使用 Doctrine 注释的多个 JoinColumn？

问题是这样的 Class Routing有属性objectId and objectType objectId是一个整数并且objectType是一个字符串这样做的原因是允许同一个表保存不同类型路由的数据例如对于路由Products
无法从 netbeans 输入值，但在 cmd 中工作

我已经在 netbeans 上安装了 MinGW 用于 C 和 C 编程这是我尝试在 netbeans 上运行的简单代码 include
如何在sql-loader中使用to_number和nullif？

我在这里遇到了类似的日期问题 to date 和 nullif 的组合如何在sql loader中使用decode 并且得到了很好的解决我的问题是 CSV 文件中的数字字段可以具有以下格式 999 999 999 99 或只是一个点对
如何在android服务中使用signalr

我用的是signalr图书馆和为我创建的问题是当电话转到sleep它将发出一个连接超时错误并且将不再连接到服务器在活动中 public class MainActivity extends AppCompatActivity Overr
用于多元时间序列的 Keras 递归神经网络

我一直在阅读有关 Keras RNN 模型 LSTM 和 GRU 的内容作者似乎主要关注语言数据或使用由先前时间步骤组成的训练实例的单变量时间序列我的数据有点不同我在 10 年里每年测量 100 000 人的 20 个变量作为输入数据

用于多元时间序列的 Keras 递归神经网络

用于多元时间序列的 Keras 递归神经网络 的相关文章

随机推荐

热门标签

用于多元时间序列的 Keras 递归神经网络的相关文章