序列到序列模型上的 Keras Attention Layer TypeError：无法迭代第一维未知的张量

2024-03-27

我正在使用张量流2.1.1并尝试使用 Attention 构建序列到序列模型。

latent_dim = 300
embedding_dim=100
batch_size  = 128

# Encoder
encoder_inputs = tf.keras.Input(shape=(None,), dtype='int32')

#embedding layer
enc_emb =  tf.keras.layers.Embedding(x_voc, embedding_dim,trainable=True)(encoder_inputs)

#encoder lstm 1
encoder_lstm = tf.keras.layers.LSTM(latent_dim,return_sequences=True,return_state=True,dropout=0.4,recurrent_dropout=0.4)
encoder_output, state_h, state_c = encoder_lstm(enc_emb)
print(encoder_output.shape)

# Set up the decoder, using `encoder_states` as initial state.
decoder_inputs = tf.keras.Input(shape=(None,), dtype='int32')

#embedding layer
dec_emb_layer = tf.keras.layers.Embedding(y_voc, embedding_dim,trainable=True)
dec_emb = dec_emb_layer(decoder_inputs)

decoder_lstm = tf.keras.layers.LSTM(latent_dim, return_sequences=True, return_state=True,dropout=0.4,recurrent_dropout=0.2)
decoder_output,decoder_fwd_state, decoder_back_state = decoder_lstm(dec_emb,initial_state=[state_h, state_c])

# Attention layer
attn_out, attn_states = tf.keras.layers.Attention()([encoder_output, decoder_output])

# Concat attention input and decoder LSTM output
decoder_concat_input = tf.keras.layers.Concatenate(axis=-1, name='concat_layer')([decoder_output, attn_out])

#dense layer
decoder_dense =  tf.keras.layers.TimeDistributed(Dense(y_voc, activation='softmax'))
decoder_outputs = decoder_dense(decoder_concat_input)

# Define the model 
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

model.summary()

当我运行这个时，我在创建注意层时遇到错误TypeError: Cannot iterate over a tensor with unknown first dimension..

我检查了尺寸encoder_output and decoder_output他们都是(None, None, 300)所以认为这可能是问题所在。但我检查了注意力示例张量流示例 https://www.tensorflow.org/api_docs/python/tf/keras/layers/Attention并且他们还拥有None注意力层输入参数的维度。

我想知道我错过了什么？请建议。

EDIT

添加堆栈跟踪

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-49-d37cd48e626b> in <module>()
     28 
     29 # Attention layer
---> 30 attn_out, attn_states = tf.keras.layers.Attention()([encoder_output, decoder_output])
     31 
     32 # Concat attention input and decoder LSTM output

~/anaconda3/lib/python3.6/site-packages/tensorflow_core/python/framework/ops.py in __iter__(self)
    546     if shape[0] is None:
    547       raise TypeError(
--> 548           "Cannot iterate over a tensor with unknown first dimension.")
    549     for i in xrange(shape[0]):
    550       yield self[i]

TypeError: Cannot iterate over a tensor with unknown first dimension.

该错误是因为 keras Attention 输出 1 张量，而您期望 2。您需要更改

attn_out, attn_states = tf.keras.layers.Attention()([encoder_output, decoder_output])

into

attn_out = tf.keras.layers.Attention()([encoder_output, decoder_output])

这是完整的模型

# Encoder
encoder_inputs = tf.keras.Input(shape=(None,), dtype='int32')

#embedding layer
enc_emb =  tf.keras.layers.Embedding(x_voc, embedding_dim)(encoder_inputs)

#encoder lstm 1
encoder_lstm = tf.keras.layers.LSTM(latent_dim, return_sequences=True,return_state=True)
encoder_output, state_h, state_c = encoder_lstm(enc_emb)

# Set up the decoder, using `encoder_states` as initial state.
decoder_inputs = tf.keras.Input(shape=(None,), dtype='int32')

#embedding layer
dec_emb = tf.keras.layers.Embedding(y_voc, embedding_dim)(decoder_inputs)

decoder_lstm = tf.keras.layers.LSTM(latent_dim, return_sequences=True, return_state=True)
decoder_output,decoder_fwd_state,decoder_back_state = decoder_lstm(dec_emb,initial_state=[state_h, state_c])

# Attention layer
attn_out = tf.keras.layers.Attention()([encoder_output, decoder_output])

# Concat attention input and decoder LSTM output
decoder_concat_input = tf.keras.layers.Concatenate(axis=-1, name='concat_layer')([decoder_output, attn_out])

#dense layer
decoder_dense =  tf.keras.layers.TimeDistributed(Dense(y_voc, activation='softmax'))
decoder_outputs = decoder_dense(decoder_concat_input)

# Define the model 
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

model.summary()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

machinelearning

Keras

deeplearning

序列到序列模型上的 Keras Attention Layer TypeError：无法迭代第一维未知的张量的相关文章

在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
如何使用我自己的自定义表单覆盖 django-rest-auth 中的表单？

我正在使用 django rest auth 并尝试通过覆盖表单的方法之一来修复密码重置视图中的错误尽管我已经使用不同的 django rest auth 表单成功完成了类似的操作但我无法让它在这个表单上工作无论我做什么都会使用旧的
绝对导入不起作用，但相对导入起作用

这是我的应用程序结构 foodo setup py foodo init py foodo py models py foodo foodo foodo py从导入类models py module from foodo models im
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
Python函数组成

我尝试使用良好的语法来实现函数组合这就是我所得到的 from functools import partial class compfunc partial def lshift self y f lambda args kwargs s
如何在动态执行的代码字符串中使用inspect.getsource？

如果我在文件中有这段代码 import inspect def sample p1 print p1 return 1 print inspect getsource sample 当我运行脚本时它按预期工作在最后一行源代码sampl
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir
Jupyter笔记本突然变得很慢

我以前在anaconda环境下运行jupyter运行得很好显示警告后 IOPub data rate exceeded The notebook server will temporarily stop sending output to
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
我可以在 if 语句中使用“as”机制吗

是否可以使用as in if类似的声明with我们使用的例如 with open tmp foo r as ofile do something with ofile 这是我的代码 def my list rtrn lst True if
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
Python 或 C 语言中的 Matlab / Octave bwdist()

有谁知道 Matlab Octave bwdist 函数的 Python 替代品此函数返回给定矩阵的每个单元格到最近的非零单元格的欧几里得距离我看到了一个 Octave C 实现一个纯 Matlab 实现我想知道是否有人必须用 AN
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
异步异常处理程序：在事件循环线程停止之前不会被调用

我正在我的异步事件循环上设置异常处理程序但是在事件循环线程停止之前它似乎不会被调用例如考虑以下代码 def exception handler loop context print Exception handler called
如何使用logging.conf文件使用RotatingFileHandler将所有内容记录到文件中？

我正在尝试使用RotatingHandler用于 Python 中的日志记录目的我将备份文件保留为 500 个这意味着我猜它将创建最多 500 个文件并且我设置的大小是 2000 字节不确定建议的大小限制是多少如果我运行下面的代码
为什么我的 PyGame 应用程序根本不运行？

我有一个简单的 Pygame 程序 usr bin env python import pygame from pygame locals import pygame init win pygame display set mode 400
在 python 中使用高精度时间戳

嘿我正在使用 python 处理日期时间我想知道解析这个时间戳的最佳方法是什么时间戳是ISO标准这里是一个例子 2010 06 19T08 17 14 078685237Z 现在到目前为止我已经使用过 time datetime d
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
防止 Ada DLL 中的名称损坏

有没有一种简单的方法可以防止在创建 Ada DLL 时 Ada 名称被破坏这是我的 adb 代码 with Ada Text IO package body testDLL is procedure Print Call is begin

随机推荐

Proxyquire、rewire、SandboxedModule 和 Sinon：优缺点

在模拟 Node 依赖项时我偶然发现了以下库代理查询 https github com thlorenz proxyquire Rewire https github com jhnns rewire 沙盒模块 https github
此 WCF 错误是什么意思：“自定义工具警告：无法导入 wsdl:portType”

我在我的解决方案中创建了一个 WCF 服务库项目并拥有对此的服务引用我使用类库中的服务因此除了类库之外我还引用了 WPF 应用程序项目中的内容服务设置直接仅更改以获得异步服务功能一切都工作正常直到我想更新我的服务参考它失败
WCF 全局 (.asax) 行为

我想创建一个全局选项当 REST 调用包含 format json 时将响应输出为 JSON 字符串如果我在方法中输入以下字符串它就会起作用 WebOperationContext Current OutgoingResponse
如何检查 Java 程序的输入/输出流是否连接到终端？

我希望 Java 程序根据其用途具有不同的默认设置详细程度可能支持彩色输出在 C 语言中有一个 isatty 函数如果文件描述符连接到终端则该函数将返回 1 否则返回 0 Java 中有类似的东西吗我没有在 JavaDoc 中
将相机置于 swift spritekit 中的节点中心

我正在用 Swift 创建一个泰拉瑞亚风格的游戏我希望玩家节点始终位于屏幕中央并且当您向右移动时方块会像在泰拉瑞亚中一样向左移动我目前正在尝试弄清楚如何保持视图以角色为中心有谁知道实现此目标的好方法自 iOS 9 OS X 10
我可以使用“eval”在 Python 中定义函数吗？ [复制]

这个问题在这里已经有答案了我想使用 eval 定义一个 Python 函数 func obj eval def foo a b return a b 但它返回无效语法错误我怎样才能做到呢顺便说一句如何在 Python 中将函数 ob
使用延迟实例化时的类型推断

为什么在使用属性的延迟实例化时 Swift 上的类型推断不起作用 class GameView UIView private lazy var animator UIDynamicAnimator referenceView self 我收
ggplot2 - 带有特殊字符/符号和实际值的方面标签？

我正在绘制一个 Rggplot2带有面的绘图facet grid and labeller label both像这样正如你所看到的我能够在图例中使用希腊字符我还想在方面标签中使用希腊符号例如 psi psi 0 1将是实际的希腊
如何使用 JSF outputStylesheet 实现 CSS 缓存清除？

在 JSF 页面模板中我使用以下代码来包含 CSS 资源
改进现有的基本 GloVe 模型

我正在使用 GloVe 作为我研究的一部分我已经从以下位置下载了模型here https nlp stanford edu projects glove 我一直在使用 GloVe 进行句子分类我正在分类的句子特定于特定领域例如某些 S
GWT 简单 Web 表单提交 - 重定向到新页面

我有一个用 Google Web 工具包编写的简单 Web 表单我希望用户在单击提交按钮时跟踪新的 URL 但是我找不到任何从 GWT 代码中将用户重定向到新 URL 的示例我怎样才能实现这个目标确切的答案是 form getEle
Rails 3.2.6 和 authlogic 3.1.3 的会话 Nil

在我们的生产站点上我们使用 Rails 3 2 3 和 authlogic 3 1 0 我可以使用任何浏览器登录我们的 Rails 应用程序我们目前正在迁移到 Rails 3 2 6 并升级以使用资产管道因此我们还将 authlogi
为什么引用静态final字段不会触发类加载？

我有一个这样的测试代码 public class Constants public static String c1 C1 static System out println Constants Class Loaded public cl
星级评定 html, css

我确实被困在这里并且需要帮助如何为每个按钮使用标签有人可以帮我完成这个星级代码吗对于每个按钮仅使用一个 a 标签并根据需要使用多个 span 标签所有帮助将不胜感激谢谢这是我的代码 h2 text align left pa
Spork 在自动测试中反复重新运行失败的测试

我有一个新项目我正在尝试使用 rspec autotest 和 spork 启动并运行它我在用导轨3 0 4 rspec 2 5 0 波克0 9 0 rc3 自动测试 4 4 6 Spork 似乎加载得很好我收到一条消息它正在侦听
有没有 JavaScript 方法可以执行 file_get_contents() ？

这里是PHP 文档 http php net manual en function file get contents php 如果我找不到纯客户端方法来执行此操作我将在 Ajax 调用中使用它如下所示 homepage file ge

如何使用 CSS 模拟“”？
我正在使用 ExtJS 编写一个 Web 应用程序我将一个表放入一个表中由于各种原因不可能将其全部重构为具有行跨度列跨度等的一个大表外部表格的单元格周围有边框我希望我的内部表格有边框between它的细胞所以我最终得到了

GetMethod 不区分大小写？

foreach var filter in filters var filterType typeof Filters var method filterType GetMethod filter if method null value

将变量从 php 传递到 javascript [重复]

这个问题在这里已经有答案了我正在尝试创建一个网站某人可以在其中创建项目并且数据库将存储一个 id 并且 php 会为该 id 生成一个 url 因此下次当该人返回该网址时它会记住该人的设置变量现在的问题是我的网站中的 jav

序列到序列模型上的 Keras Attention Layer TypeError：无法迭代第一维未知的张量

我正在使用张量流2 1 1并尝试使用 Attention 构建序列到序列模型 latent dim 300 embedding dim 100 batch size 128 Encoder encoder inputs tf keras I

热门标签

TSU

GEM

打包整合到

Portainer

转换时间的正确姿势

扩展的正确姿势

quill

成功的过程

Sortable

sortablejs

最新版安装单机版

下串口读写通信

注解优化代码

解决磁盘不足的情况

1553

浅谈威佐夫博弈

UVA1185

来开辟内存空间

高通挂载

进行图片传输

strchrnull

中查看磁盘空间大小

Powered by Hwhale

序列到序列模型上的 Keras Attention Layer TypeError：无法迭​​代第一维未知的张量

序列到序列模型上的 Keras Attention Layer TypeError：无法迭​​代第一维未知的张量 的相关文章

随机推荐

热门标签

序列到序列模型上的 Keras Attention Layer TypeError：无法迭代第一维未知的张量

序列到序列模型上的 Keras Attention Layer TypeError：无法迭代第一维未知的张量的相关文章