Keras 中的 Seq2Seq 双向编码器解码器

2024-02-22

我正在尝试使用 Keras 实现 seq2seq 编码器-解码器，并在编码器上使用双向 lstm，如下所示：

from keras.layers import LSTM,Bidirectional,Input,Concatenate
from keras.models import Model

n_units = 8
n_input = 1
n_output = 1

# encoder
encoder_inputs = Input(shape=(None, n_input))
encoder = Bidirectional(LSTM(n_units, return_state=True))
encoder_outputs, forward_h, forward_c, backward_h, backward_c = encoder(encoder_inputs)
state_h = Concatenate()([forward_h, backward_h])
state_c = Concatenate()([forward_c, backward_c])
encoder_states = [state_h, state_c]

# decoder
decoder_inputs = Input(shape=(None, n_output))    
decoder_lstm = LSTM(n_units*2, return_sequences=True, return_state=True)
decoder_outputs, _, _ = decoder_lstm(decoder_inputs, initial_state=encoder_states)

这是我在最后一行遇到的以下错误：

ValueError: Dimensions must be equal, but are 8 and 16 for 
'lstm_2_1/MatMul_4' (op: 'MatMul') with input shapes: [?,8], [16,16].

有任何想法吗？

尽管错误指向问题中块的最后一行，但这是由于推理解码器中隐藏单元的数量错误造成的。解决了！

完整的工作代码：

from keras.layers import LSTM,Bidirectional,Input,Concatenate
from keras.models import Model

n_units = 8
n_input = 1
n_output = 1

# encoder
encoder_inputs = Input(shape=(None, n_input))
encoder = Bidirectional(LSTM(n_units, return_state=True))
encoder_outputs, forward_h, forward_c, backward_h, backward_c = encoder(encoder_inputs)
state_h = Concatenate()([forward_h, backward_h])
state_c = Concatenate()([forward_c, backward_c])
encoder_states = [state_h, state_c]

# decoder
decoder_inputs = Input(shape=(None, n_output))    
decoder_lstm = LSTM(n_units*2, return_sequences=True, return_state=True)
decoder_outputs, _, _ = decoder_lstm(decoder_inputs, initial_state=encoder_states)
decoder_dense = Dense(n_output, activation='softmax')
decoder_outputs = decoder_dense(decoder_outputs)
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)


# define inference encoder
encoder_model = Model(encoder_inputs, encoder_states)
# define inference decoder
decoder_state_input_h = Input(shape=(n_units*2,))
decoder_state_input_c = Input(shape=(n_units*2,))
decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]
decoder_outputs, state_h, state_c = decoder_lstm(decoder_inputs, initial_state=decoder_states_inputs)
decoder_states = [state_h, state_c]
decoder_outputs = decoder_dense(decoder_outputs)
decoder_model = Model([decoder_inputs] + decoder_states_inputs, [decoder_outputs] + decoder_states)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

Keras

LSTM

recurrentneuralnetwork

Seq2Seq

Keras 中的 Seq2Seq 双向编码器解码器的相关文章

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个
R中的神经网络包出现大错误

我正在尝试弄清楚如何使神经网络包发挥作用我用我创建的数据及其结果大约 50 行数据和三列第四列是我想要的结果它是通过简单的数学执行如对其他三列求和得出的进行了一些测试到目前为止一切顺利然后我决定将这个包应用到真实数据上我
无效参数：indices[0,0] = -4 不在 [0, 40405) 中

我有一个模型可以处理一些数据我在数据集中添加了一些标记化的单词数据为简洁起见有些被截断 vocab size len tokenizer word index 1 comment texts df comment text values
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
Keras-批次内每个样本的损失

如何在训练时获得样本损失而不是总损失损失历史记录可提供总批次损失但不提供单个样品的损失如果可能的话我想要这样的东西 on batch end batch logs sample losses 是否有类似的东西可用如果没有您能否提供
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
神经网络不能立即重现？

通过使用反向传播导数弹性的前馈神经网络中的随机权重初始化误差图上的初始位置位于某个随机谷的顶部该随机谷可能是也可能不是局部最小值可以使用方法来克服局部最小值但假设这些方法没有被使用或者在给定的地形上不能很好地工作那么神经网络

随机推荐

如何将日期时间显示为当地时间，末尾不带时区？

编辑由于一些看似混乱的情况让我澄清一下如果可能的话我希望解决方案在 freemarker 中完成而不是在 java 中完成我有一个日期时间字符串如下所示 2019 03 12T16 02 00 02 00我必须以特定的格式来显
是否有任何免费或商业 jpeg 解码速度非常快 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在使用 c libjpeg 来解
颜色不适用于活动按钮

我试图在按下按钮时将 css 字体颜色更改为白色但是目前我可以执行此操作的唯一方法是使用 important 并强制更改颜色有没有办法在不使用 important 的情况下做到这一点这是我的代码目前按钮字体颜色更改为 modal
如何从xml文件中检索值并在html网页中显示？

以下是 XML FILE 的代码
通过 PHP 脚本下载文件会导致错误/不同的 md5 校验和 - 为什么？

我正在尝试通过 PHP 实现间接下载在客户端我使用 md5 验证下载的文件是否正确当我直接下载文件时 http server folder file apk http server folder file apk 我得到与文件系统上相
在 pgAdmin 中选择整列内容

我使用 PostgreSQL 作为数据库使用 PgAdmin 作为管理它的工具当我写简单的选择时 col是文本类型它的值很长大约4k个字符 SELECT col FROM tab 我明白了括号前大约有 250 个字符 ababab
使用日期时如何在 Altair 中获得选择间隔的初始值？

我试图在 Altair 图中为选择间隔设置初始值但我一直无法弄清楚这是一个代码片段 df pd DataFrame date 0 2005 03 01 1 2005 04 01 2 2005 05 02 values 0 89 2506
将测试客户端数据转换为 JSON

我正在构建一个应用程序我想做一些测试我需要将测试客户端的响应数据转换为 JSON The app tasks id 1 title u Buy groceries description u Milk Cheese Pizza Frui
我们使用 BouncyCastle API 为客户端加密文件。当他尝试解密时，他收到了来自 PGP 的“仅供您查看”的消息。为什么？

我们使用 Bouncy Castle C API 进行 PGP 加密我绝不是 PGP 加密和各种可用选项方面的专家加密似乎运行良好但是当客户端尝试解密时他说 PGP 不会输出到文件而只会输出到屏幕因为它被标记为仅供您查看这
有关“gladLoadGL”的问题。我收到一条错误消息，指出它不需要 1 个参数

我正在尝试做一些 openGL 教程 https www glfw org docs latest quick guide html quick example https www glfw org docs latest quick gu
在android中引用javax.script.ScriptEngine或评估javascript表达式

开发android应用程序时是否可以引用javax script ScriptEngine库如果没有的话是否有可能在android中评估javascript表达式对于 javax script ScriptEngine javax s
Boost 解析日期/时间字符串并生成 .NET 兼容的 Ticks 值

我想使用 C Boost 来解析时间字符串例如1980 12 06 21 12 04 232并获得一个ticks对应于刻度计数的值用于初始化 NETSystem DateTime 我该怎么做 Update I do需要使用C 我不能为此
如何从维基百科 API 获取表中的数据？

我正在尝试从中获取所有内容维基百科 Unusual articles https en wikipedia org wiki Wikipedia Unusual articles我可以通过调用此端点来获取表内容列表 https en wik
如何限制文本宽度

我想限制文本块的宽度这样它看起来就像在每行的 ned 处都有 br 像这样的事情 Texttttttttttttttttttttt tttttttttttttttttttttttt tttttttttttttttttttttttt 由此
UICollectionView 的 iOS 字母滚动

我有一个集合视图显示人物及其姓名的多个图像并且我已经实现了搜索和排序功能但是问题是我也想要按字母顺序排列但是集合视图没有像这样的委托方法UITableView has NSArray sectionIndexTitlesForTa
C++ 编程帮助

您创建一个程序显示用户输入的两个数字之间含的偶数之和例如 2 和 7 12 之和 2 4 6 这就是我到目前为止所拥有的但如果你能让我朝着正确的方向前进那就会有帮助了 Advanced30 cpp displays the su
如何以编程方式从父进程获取子进程的堆栈跟踪？

假设我在程序中派生了一个子进程在某个时候我暂停子进程kill child SIGSTOP 并想要检查堆栈的内容有没有办法以编程方式从父进程获取子进程的堆栈跟踪我知道ptrace是跟踪子进程并检查其内存寄存器的标准方法我也知道ba
使用 C/C++ 创建多线程应用程序的最简单方法是什么？

使用 C C 创建多线程应用程序的最简单方法是什么不幸的是没有简单的方法有几个选项 Linux 上的 pthread Windows 上的 win32 api 线程或 boost thread 库
如何在运行时查找已加载的 d3.js 扩展及其版本？

按照 JavaScript 库的惯例全局根对象由d3 js https d3js org 有一个自我识别属性该属性返回并因此在控制台中调用时输出所用库的版本在这种情况下它是 d3 version Now 从 4 0 版本开始 d
Keras 中的 Seq2Seq 双向编码器解码器

我正在尝试使用 Keras 实现 seq2seq 编码器解码器并在编码器上使用双向 lstm 如下所示 from keras layers import LSTM Bidirectional Input Concatenate from

Keras 中的 Seq2Seq 双向编码器解码器

Keras 中的 Seq2Seq 双向编码器解码器 的相关文章

随机推荐

热门标签

Keras 中的 Seq2Seq 双向编码器解码器的相关文章