PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度

2023-12-01

我正在使用 PyTorch 构建 DecoderRNN （这是一个图像标题解码器）：

class DecoderRNN(nn.Module):
    def __init__(self, embed_size, hidden_size, vocab_size):

        super(DecoderRNN, self).__init__()
        self.hidden_size = hidden_size
        self.gru = nn.GRU(embed_size, hidden_size, hidden_size)
        self.softmax = nn.LogSoftmax(dim=1)

    def forward(self, features, captions):

        print (features.shape)
        print (captions.shape)
        output, hidden = self.gru(features, captions)
        output = self.softmax(self.out(output[0]))
        return output, hidden

数据具有以下形状：

torch.Size([10, 200])  <- features.shape (10 for batch size)
torch.Size([10, 12])   <- captions.shape (10 for batch size)

然后我收到以下错误。我在这里错过了什么想法吗？谢谢！

---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
<ipython-input-2-76e05ba08b1d> in <module>()
     44         # Pass the inputs through the CNN-RNN model.
     45         features = encoder(images)
---> 46         outputs = decoder(features, captions)
     47 
     48         # Calculate the batch loss.

/opt/conda/lib/python3.6/site-packages/torch/nn/modules/module.py in __call__(self, *input, **kwargs)
    323         for hook in self._forward_pre_hooks.values():
    324             hook(self, input)
--> 325         result = self.forward(*input, **kwargs)
    326         for hook in self._forward_hooks.values():
    327             hook_result = hook(self, input, result)

/home/workspace/model.py in forward(self, features, captions)
     37         print (captions.shape)
     38         # features = features.unsqueeze(1)
---> 39         output, hidden = self.gru(features, captions)
     40         output = self.softmax(self.out(output[0]))
     41         return output, hidden

/opt/conda/lib/python3.6/site-packages/torch/nn/modules/module.py in __call__(self, *input, **kwargs)
    323         for hook in self._forward_pre_hooks.values():
    324             hook(self, input)
--> 325         result = self.forward(*input, **kwargs)
    326         for hook in self._forward_hooks.values():
    327             hook_result = hook(self, input, result)

/opt/conda/lib/python3.6/site-packages/torch/nn/modules/rnn.py in forward(self, input, hx)
    167             flat_weight=flat_weight
    168         )
--> 169         output, hidden = func(input, self.all_weights, hx)
    170         if is_packed:
    171             output = PackedSequence(output, batch_sizes)

/opt/conda/lib/python3.6/site-packages/torch/nn/_functions/rnn.py in forward(input, *fargs, **fkwargs)
    383             return hack_onnx_rnn((input,) + fargs, output, args, kwargs)
    384         else:
--> 385             return func(input, *fargs, **fkwargs)
    386 
    387     return forward

/opt/conda/lib/python3.6/site-packages/torch/autograd/function.py in _do_forward(self, *input)
    326         self._nested_input = input
    327         flat_input = tuple(_iter_variables(input))
--> 328         flat_output = super(NestedIOFunction, self)._do_forward(*flat_input)
    329         nested_output = self._nested_output
    330         nested_variables = _unflatten(flat_output, self._nested_output)

/opt/conda/lib/python3.6/site-packages/torch/autograd/function.py in forward(self, *args)
    348     def forward(self, *args):
    349         nested_tensors = _map_variable_tensor(self._nested_input)
--> 350         result = self.forward_extended(*nested_tensors)
    351         del self._nested_input
    352         self._nested_output = result

/opt/conda/lib/python3.6/site-packages/torch/nn/_functions/rnn.py in forward_extended(self, input, weight, hx)
    292             hy = tuple(h.new() for h in hx)
    293 
--> 294         cudnn.rnn.forward(self, input, hx, weight, output, hy)
    295 
    296         self.save_for_backward(input, hx, weight, output)

/opt/conda/lib/python3.6/site-packages/torch/backends/cudnn/rnn.py in forward(fn, input, hx, weight, output, hy)
    206         if (not is_input_packed and input.dim() != 3) or (is_input_packed and input.dim() != 2):
    207             raise RuntimeError(
--> 208                 'input must have 3 dimensions, got {}'.format(input.dim()))
    209         if fn.input_size != input.size(-1):
    210             raise RuntimeError('input.size(-1) must be equal to input_size. Expected {}, got {}'.format(

RuntimeError: input must have 3 dimensions, got 2

您的 GRU 输入需要是 3 维的：

input形状（seq_len，batch，input_size）：包含输入序列特征的张量。

此外，您需要提供隐藏状态（在本例中为最后一个编码器隐藏状态）作为第二个参数：

self.gru(input, h_0)

Where input是你的实际输入h_0隐藏状态也需要是 3 维的：

h_0形状（num_layers * num_directions、batch、hidden_size）：张量包含批次中每个元素的初始隐藏状态。如果未提供，则默认为零。

https://pytorch.org/docs/master/nn.html#torch.nn.GRU

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

Pytorch

recurrentneuralnetwork

EncoderDecoder

PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度的相关文章

使用 joblib 加载 pickled scikit-learn 模型时出现 KeyError

我有一个对象其中包含两个scikit learn模型一个IsolationForest and a RandomForestClassifier 我想对其进行 pickle 然后将其解开并用于生成预测除了两个模型之外该对象还包含几个
Python 3.7 RPM 创建

我正在尝试通过以下方式为 Python 3 7 3 创建 RPM 文件Python RPM https docs python org 3 distutils builtdist html但收到文件未找到错误请按照以下链接查看日志 L
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
有没有办法在每个特定的时间间隔运行 python Flask 函数并在本地服务器上显示输出？

我正在使用 Flask 工作 python 程序我想从字典中提取键该密钥为文本格式但我想在每个特定的时间间隔后重复上述整个过程并每次在本地浏览器上显示此输出我已经使用flask apscheduler尝试过这个程序只运行一次并显
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
将 numpy.get_include() 参数添加到 setuptools 中，无需预安装 numpy

我目前正在开发一个 python 包它使用cython and numpy我希望可以使用以下命令安装该软件包pip install来自干净的 python 安装的命令所有依赖项都应自动安装我在用setuptools与以下setup p
在Spyder(Python 3.6)中导入cv2时出现导入错误

我已经在Windows操作系统中安装了opencv 3 0 0 我已运行该应用程序并已成功将其安装在C 驱动器并还复制了cv2 pyd文件输入C Python27 Lib site packages正如我在几个教程视频中看到的那样在我的
Windows 中的 Python 多处理池奇怪行为

Python 多处理池在 Linux 和 Windows 之间有不同的行为当按工作人员数量运行方法映射时在 Linux 中它会在您作为参数提供的特定函数的范围内运行该进程但在 Windows 中每个工作进程都在父进程的范围内运行
pip 安装最新的依赖版本

当我使用安装包时pip install e 它仅安装不满足的依赖项并忽略依赖项升级如何在每次运行时安装最新的依赖版本pip install e 我尝试过使用pip install upgrade e 但是使用这个选项没有任何改变我仍然得
在 SSLwrapp() 之前在原始套接字上接收/发送，Python

我想知道在包装原始套接字之前是否可以在原始套接字上接收发送数据我已经查看了文档并搜索了它但找不到任何具体内容我基本上想做的事情 client addr listeningSocket accept client recv 32 cl
如何在 psycopg2 线程连接类中重新连接到 postgreSQL？ SSL SYSCALL 错误导致的失败：在 Azure 中检测到 EOF？

我们的应用程序运行良好直到我们将 PostgreSQL 移植到 Azure 中的 Microsoft 数据库然后我们的应用程序会定期无故失败并且到处都会出现 SSL SYSCALL 错误删除等我们已经尝试了互联网上描述的所有内容
仅使用 pathlib 规范化不存在的路径

python 最近添加了pathlib https docs python org 3 4 library pathlib html module pathlib模块我非常喜欢我只有一件事正在努力解决是否可以规范化不存在的文件或目录的
相当于“setup.py”中的“--find-links”

相当于什么 find links f标记为pip in setup py I know dependency links存在但这需要指向一个特定的文件我想要类似的东西 f它可以指向一个链接列表可以根据版本和操作系统从中选择包 In a
如果多个测试有特定异常，则停止 pytest 测试

我想使用停止测试套件pytest exit 如果任何测试因特定异常而失败例如 50 个测试其中任何一个都可能在某个时刻因该异常而失败如果这些测试中至少有 2 个测试因该异常而失败我想停止执行我试图保留一个全局计数器一个固定装置s
如何将 35 类城市景观数据集转换为 19 类？

以下是我的代码的一小段使用它我可以在城市景观数据集上训练名为 lolnet 的模型但数据集包含 35 个类别标签 0 34 imports trainloader torch utils data DataLoader datase
尽管获得了许可，Discord 机器人仍无法提及所有人

这是发送消息函数 async def sendMessage color title value should delete True channel embed discord Embed color color embed add fi
Python 3 在除两个大数时给出错误的输出？

a 15511210043330985984000000 25 b 479001600 12 c 6227020800 13 关于划分ans int a b c or ans int a b c we get ans等于5200299代替5
在 tkinter 和 python 中嵌套网格和框架

我正在尝试在更大的网格结构中的框架内设置一个网格我试图将其提炼为问题的最简单版本 from tkinter import Tk Frame Label Entry root Tk root geometry 800x800 frame1

随机推荐

MySQL 对字符串第一部分的索引

我正在 MySQL 中查询一个非常大的表超过 3M 条记录其中包含category id subcategory id 和邮政编码数据库中的 zip 可能是也可能不是 10 个字符目的是获取指定邮政编码的特定半径内的所有目录子目录
Spring 注解 - 注入对象映射

使用 XML 注释我使用以下配置注入地图
PHP debug_backtrace 在生产代码中获取有关调用方法的信息？

是否有令人信服的理由不使用debug backtrace仅仅是为了确定调用方法的类名称和参数列表吗不用于调试目的它的函数名称中有 debug 一词这让我觉得以这种方式使用它有点肮脏但它符合我需要做的事情一个可以从许多地方调用的单
嵌入式linux ARM启动地址

我按照一些文档通过 sdcard 在 ARM 板例如 Freescale Vybrid tower 上启动嵌入式 Linux 在文档中有构建 uImage 并将 u boot 写入 sdcard 的步骤如下所示 sudo dd if
LNK2019问题

我有一个LNK2019尝试在我的项目中使用某些 DLL 时出现问题 Details 我有一个名为 dll1 的 DLL 项目编译得很好使用 declspec dllexport 以便导出 dll1 内的类供 dll2 使用我有另一个
如何将现有的 React 应用程序（只是一个没有后端的 UI）插入（注入？）到 SilverStripe 页面布局中？

我的问题是我一直在阅读 SilverStripe 4 文档以便找到一种将现有 React 应用程序只是没有后端的嵌套 React 组件的 UI 插入 SilverStripe 页面布局的方法这可能吗如何确保 SilverStrip
php 无法在 wampserver 的 html 代码中工作

事情是这样的我有一个名为first php 的文件其中包含以下代码 welcome br 但是当我执行它时 php 代码不会被解释短开标签似乎也已打开我正在使用 wampserver 我错过了什么您的服务器似乎配置错误您的
python 数组赋值与标量赋值

我有一个二维数组A形状的 4 3 和一个一维数组a形状的 4 我想交换前两行A 以及中的前两个元素a 我做了以下事情 A 0 A 1 A 1 A 0 a 0 a 1 a 1 a 0 显然它适用于a 但失败了A 现在第二行成为第一行但第
Selenium IDE：将测试脚本包含到新的测试脚本中

我们谷歌找到解决方案但没有成功我们如何将已经录制的脚本添加到新脚本中 Selenium Core有一个扩展 include 可以将另一个测试的内容添加到当前测试中这是 OpenQA wiki 上的页面 http wiki openqa
编写一个终端仿真器，里面有什么？

这有点关系到这个问题关于 cmd exe 的更好的 shell 终端 gui 界面在我寻找更好的 shell 终端的过程中我遇到的唯一有用的东西是Console2 其他替代品不是免费的而且通常不会比 Console2 提供更多的功能来
我在这个乒乓球游戏中制作了一个边界，但球拍可以穿过它。我该如何阻止呢？

我在这个乒乓球游戏中做了一个边框屏幕上的球拍可以越过它我之前已经在另一段代码中完成了此操作但现在一切都不同了我有一个关于如何做到这一点的主要想法你可能需要一个 if 语句但我没有一切您可以删除 pygame load imag
使用模式在 Jasper Reports 中设置货币格式

我有一个查询从表中返回金额 select bus price from mySchema BusTable 这将返回如下金额 526547 123456 456789 25 12478 35 我在贾斯珀报告中使用了上述金额但是我希望报告
快速裁剪视频

我正在方形 UIView 中录制视频但是当我导出视频时视频是全屏 1080x1920 现在我想知道如何将视频从全屏缩小为方形比例 1 1 以下是我设置摄像机的方法 session AVCaptureSession for device
数据匹配算法

我目前正在开展一个项目需要实现数据匹配算法外部系统传递它所知道的有关客户的所有数据而我设计的系统必须返回匹配的客户因此外部系统知道客户的正确 ID 并获取其他数据或可以更新其自己的特定客户数据传入以下字段 Name Name2
使用 .clone() 复制二维数组仍然引用原始数据

好的我知道这个问题之前已经被问过上一个问题我还研究了其他一些线程和网站它们似乎都产生了比答案更多的问题乔什布洛赫谈设计一篇文章讨论 clone 但我仍然无法找到问题的答案当我克隆二维数组时 values Map mapVal
Postgres 连接表的唯一多列索引

我在 Postgres 中有一个多对多连接表我想将其索引到 A 提高性能显然和 B 强制唯一性例如 a id b id 1 2 lt okay 1 3 lt okay 2 3 lt okay 1 3 lt not okay same
回显到文件而不带换行符（批量）[重复]

这个问题在这里已经有答案了我的生活创造者计划有问题它只是选择代表某些内容的随机数并将其放在一起我尝试过组合变量这是代码 set num 1 SET A a RANDOM 10 32768 1 if a 10 set life num
在哪里为所有 HttpRequest 设置自定义 ClaimsPrincipal

我正在将旧应用程序移植到 ASP NET Core 它使用 Windows 身份验证在 IIS 中配置分别为 launchsetting json 在开发模式下运行时我想覆盖身份验证以使用自定义硬编码的 ClaimsPrincipal
如何防止 QTableview 中过于激进的文本删除？

I have an issue with text elide in Qt being too aggressive in a table see picture 带有完整数字0 8888的单元格自从显示QTableWidget以来我已经
PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度

我正在使用 PyTorch 构建 DecoderRNN 这是一个图像标题解码器 class DecoderRNN nn Module def init self embed size hidden size vocab size super

PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度

PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度 的相关文章

随机推荐

热门标签

PyTorch：DecoderRNN：运行时错误：输入必须有 3 个维度，得到 2 个维度的相关文章