尝试理解 Pytorch 的 LSTM 实现

2024-04-19

我有一个包含 1000 个示例的数据集，其中每个示例都有5特征（a、b、c、d、e）。我想喂7LSTM 的示例，以便它预测第 8 天的特征 (a)。

阅读 nn.LSTM() 的 Pytorchs 文档，我得出以下结论：

input_size = 5
hidden_size = 10
num_layers = 1
output_size = 1

lstm = nn.LSTM(input_size, hidden_size, num_layers)
fc = nn.Linear(hidden_size, output_size)

out, hidden = lstm(X)  # Where X's shape is ([7,1,5])
output = fc(out[-1])

output  # output's shape is ([7,1])

根据文档：

nn.LSTM 的输入是“输入形状（seq_len、批次、input_size

当我将您的代码扩展为完整的示例时——我还添加了一些可能有帮助的注释——我得到以下信息：

import torch
import torch.nn as nn

input_size = 5
hidden_size = 10
num_layers = 1
output_size = 1

lstm = nn.LSTM(input_size, hidden_size, num_layers)
fc = nn.Linear(hidden_size, output_size)

X = [
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
    [[1,2,3,4,5]],
]

X = torch.tensor(X, dtype=torch.float32)

print(X.shape)         # (seq_len, batch_size, input_size) = (7, 1, 5)
out, hidden = lstm(X)  # Where X's shape is ([7,1,5])
print(out.shape)       # (seq_len, batch_size, hidden_size) = (7, 1, 10)
out = out[-1]          # Get output of last step
print(out.shape)       # (batch, hidden_size) = (1, 10)
out = fc(out)          # Push through linear layer
print(out.shape)       # (batch_size, output_size) = (1, 1)

这对我来说很有意义，考虑到你batch_size = 1 and output_size = 1（我假设，你正在做回归）。我不知道你在哪里output.shape = (7, 1)来自。

您确定您的X有正确的尺寸吗？你创建了吗nn.LSTM也许与batch_first=True？有很多小东西可以潜入。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

deeplearning

LSTM

Pytorch

recurrentneuralnetwork

尝试理解 Pytorch 的 LSTM 实现的相关文章

使用 Spark 结构化流进行实时数据标准化/归一化

在实现机器学习算法时标准化归一化数据即使不是关键也是至关重要的一点使用 Spark 结构化流以实时方式执行此操作是过去几周我一直试图解决的问题使用StandardScaler估计器 value i mean standard de
在Tensorflow中，sampled_softmax_loss和softmax_cross_entropy_with_logits有什么区别

在张量流中有一些方法称为softmax cross entropy with logits https www tensorflow org versions master api docs python tf nn softmax cr
使用 keras 和多个序列进行时间序列预测

我明白了有状态 LSTM 预测示例 https github com fchollet keras blob master examples stateful lstm py在 Keras 中的单个序列上该示例有一个包含 50k 个观察值
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
梯度下降Matlab实现

我已经浏览了堆栈溢出中的许多代码并在同一行上编写了自己的代码这段代码有一些问题我无法理解我正在存储值 theta1 和 theta 2 以及用于分析目的的成本函数 x 和 Y 的数据可以从此下载页它具有 dat 文件形式的 x 和
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
如何使用keras打印神经网络中预测类的名称？

我在 keras 中使用预先训练的模型最终将类索引预测为一些整数值但我似乎不明白如何打印这些类的名称我使用的模型是 ResNet 50 看一下https martin thoma com image classification ht
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
在 Tensorflow 中混合前馈层和循环层？

有人能够在 Tensorflow 中混合前馈层和循环层吗例如输入 gt 转换 gt GRU gt 线性 gt 输出我可以想象一个人可以用前馈层定义自己的单元并且没有状态然后可以使用 MultiRNNCell 函数进行堆叠如下所示
没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
如果我使用不同数量的核心，XGBoost 会产生相同的结果吗？

我在两台机器上安装了完全相同版本的 XGBoost 0 4 两台机器之间的唯一区别是 RAM 和内核数量 8 与 16 使用完全相同的数据我无法重现相同的结果它们略有不同小数点后第四第五位种子保留为默认值它是高度特定于实现的但
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
实例标准化与批量标准化

据我所知批量归一化通过将激活转向单位高斯分布来帮助加快训练速度从而解决梯度消失问题批量归一化行为在训练使用每个批次的平均值 var 和测试时间使用训练阶段的最终运行平均值 var 时应用不同另一方面实例归一化充当本文提到的对比
Tensorflow：np数组的next_batch函数

我的火车数据为 xTrain numpy asarray 100 1 5 6 yTrain numpy asarray 200 2 10 12 如何定义 next batch size 方法以从训练数据中获取随机元素的 size 个数您可

随机推荐

带有 vararg observables 的 RxJava zip

当我们确切地知道有多少个具有确切类型的可观察量并且我们想要压缩时我们会这样做 Observable
JetBrains IDE 启动时出错：应用程序无法正确启动 (0xc000007b)

我遇到了这个错误但在重新安装 IDE 两次后几乎找不到解决方案甚至我安装了多合一运行时但这也无济于事因为我认为问题最初是在我更改了 Windows Defender 设置中的一些设置后开始的然后尝试重置它们但肯定其他人报告了这个
lambda：通过引用捕获 const 引用是否应该产生未定义的行为？

我刚刚在代码中发现了一个令人讨厌的错误因为我通过引用捕获了对字符串的 const 引用当 lambda 运行时原始字符串对象已经消失了引用的值是空的而目的是它包含原始字符串的值因此出现了错误让我困惑的是这并没有在运行时引发崩
BigInteger 数字的实现和性能

我用 C 编写了一个 BigInteger 类它应该能够对任何大小的所有数字进行运算目前我正在尝试通过比较现有算法并测试它们最适合哪些位数来实现非常快速的乘法方法但我遇到了非常意外的结果我尝试进行 20 次 500 位数字的乘法
Inflector.Net 的替代品

我想在我的项目中使用 inflector net 刚刚谷歌了一下好像已经消失了 http andrewpeters net inflectornet http andrewpeters net inflectornet 还有其他选择吗编
Chrome 开发工具中的 __puppeteer_evaluation_script__ 为空

Puppeteer 版本 9 0 0 将调试器放入 JavaScript 代码并启动 puppeteer 时 chrome 开发工具中的源代码为空使用 Node 运行脚本 scripts test echo Error no test s
Docker 和 Python virtualenv 有什么区别？

根据我对Docker的理解它是一个用于虚拟环境的工具用他们的行话来说这称为容器化这或多或少就是 Python 的 virtualenv 所做的事情但是您可以使用 virtualenvin码头工人那么它是虚拟环境中的虚拟环境
如何监控 Tomcat 服务器上的多个 Web 应用程序（使用 JMX）？

有没有办法监控单个 Web 应用程序的 CPU 和内存消耗Tomcat server I have Tomcat打开其 JVM 下的所有 Web 应用程序因此我只能看到一个 JVM 无法单独监控每个 Web 应用程序 Web 应用程序是密
jquery中删除多个元素

在我当前的代码中我有这样的 foo remove bar remove 有没有办法通过使用删除多个元素remove once 它不限于 remove 但只需用逗号分隔选择器 foo bar remove 多重选择器选择器1 选择器2 选择
如何调整 UIImageView 的大小以适应底层图像而不移动它？

我有一个 UIImageView 其框架在加载图像之前设置对于图像来说总是太大因此例如当我尝试圆角时什么也没有发生如何调整框架大小使其与底层图像的大小相同同时确保 UIImageView 的中心点不会改变如果更改 UIVi
CPython的静态对象地址和碎片

I read 对于Python来说 if x 是存储x的内存地址这是给定的id对象的属性永远不会改变这意味着对象在其生命周期中始终存储在给定的内存地址中这就引出了一个问题虚拟内存碎片怎么样说一个物体A位于地址 1 有id1 占用
IIS7的工作进程是什么？

我正在尝试在 Visual Studio 2008 中执行附加到进程进行调试但我无法弄清楚要附加到哪个进程帮助事实上它仍然是 w3wp exe 您需要检查显示所有会话中的进程让它显示的选项这也让我困惑了一段时间
如果不调用notify()，等待线程会发生什么？

如果不调用notify 等待线程会发生什么这是虚假唤醒吗 If a waiting Thread is not notified通过致电notify or notifyAll 在所述线程正在等待的对象上则可能会发生以下任一情况 the
Chrome 调试协议：HeapProfiler.getHeapSnapshot 忽略回调

我正在开发一个测试套件作为 Chrome 扩展实现该套件使用 Chrome Chromium 的远程调试协议以编程方式获取和分析堆快照因为Profiler 似乎不是公共协议的一部分我正在使用这一页 http trac webkit
HTML 多选框

我只是想知道下面的表格的名称是什么我从早上就在谷歌上搜索 HTML 表单列表但我在任何地方都找不到这种表单谁能告诉我这个表单的确切名称以及它是否可以在 HTML 表单中使用我只想在我的网站中添加这种形式它适用于 HTML 还是我应
将变量传递给 Google Cloud Functions

我刚刚在 Beta Python 3 7 运行时中使用 HTTP 触发器编写了 Google Cloud Function 现在我试图弄清楚如何在调用函数时将字符串变量传递给函数我已阅读文档但没有找到任何相关内容我的触发器类似于 ht
如何在光线平行且不使用光线模式的情况下运行函数？

After sudo pip3 install ray 我创建了一个函数foo 在射线装饰器中定义 import ray ray init ray remote def foo x print x 我希望能够使用foo并行和常规模式忽略装
ViewModel 和 Service 类的实例化

我试图理解 ViewModel 和 Service 类的实例化并将其写下来供其他人使用请在需要的地方更正添加 ViewModel 和服务的实例化并不是以最常见的方式完成的这是使用反射完成的在 TipCalc 中您有 public
在特定日期触发 UILocalNotification

我想开火UILocalNotification在特定日期如果我使用这段代码 NSCalendar gregorian NSCalendar alloc initWithCalendarIdentifier NSGregorianCalen
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid

尝试理解 Pytorch 的 LSTM 实现

尝试理解 Pytorch 的 LSTM 实现 的相关文章

随机推荐

热门标签

尝试理解 Pytorch 的 LSTM 实现的相关文章