TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？

2024-02-20

我已将 embedding_attention_seq2seq 模块用于机器翻译任务，如以下指定的教程中所述：

https://www.tensorflow.org/versions/master/tutorials/seq2seq/index.html https://www.tensorflow.org/versions/master/tutorials/seq2seq/index.html

In the seq2seq_model.py在教程中指定模型，我注意到他们默认使用 GRUCell 如果use_lstm被设定为false在这些行中：

# Create the internal multi-layer cell for our RNN.
single_cell = tf.nn.rnn_cell.GRUCell(size)
if use_lstm:
  single_cell = tf.nn.rnn_cell.BasicLSTMCell(size)
cell = single_cell
if num_layers > 1:
  cell = tf.nn.rnn_cell.MultiRNNCell([single_cell] * num_layers)

现在论文中描述的注意力机制here https://arxiv.org/pdf/1409.0473v7.pdf/如果编码器是双向的并且上下文化考虑到隐藏层参数，那么本教程指定的所实现的模型将具有更多的语义意义。 seq2seq_model 文件没有提及双向组件。

所以我的问题是，embedding_attention_seq2seq 默认实现双向 RNN 编码器吗？

如果不是，它是否只是简单地获取普通 LSTM 编码器每个时间步长的隐藏层输出，从而将上下文限制为仅句子中之前出现过的单词？

所以我的问题是，embedding_attention_seq2seq 默认实现双向 RNN 编码器吗？

不，它没有实现双向 RNN 编码器。编码器的输出（用于构建注意力状态）是在前几行内构建的embedding_attention_seq2seq:

# Encoder.
encoder_cell = rnn_cell.EmbeddingWrapper(
    cell, embedding_classes=num_encoder_symbols,
    embedding_size=embedding_size)
encoder_outputs, encoder_state = rnn.rnn(
    encoder_cell, encoder_inputs, dtype=dtype)

第一行用嵌入包裹单元格。第二个运行的是encoder_cell转发到encoder_inputs（第 210-228 行tf/python/ops/rnn.py).

如果不是，它是否只是简单地获取普通 LSTM 编码器每个时间步长的隐藏层输出，从而将上下文限制为仅句子中之前出现过的单词？

这是正确的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？的相关文章

如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
如何在 Tensorflow 对象检测 API 中查找边界框坐标

我正在使用 Tensorflow 对象检测 API 代码我训练了我的模型并获得了很高的检测百分比我一直在尝试获取边界框坐标但它不断打印出 100 个奇怪数组的列表经过在线广泛搜索后我发现数组中的数字意味着什么边界框坐标相对于底层
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不

随机推荐

在 C# 中从字符串调用函数

我知道在 php 中你可以进行如下调用 function name hello function name function hello echo hello 这在 Net 中可能吗是的您可以使用反射像这样的事情 Type thisT
同一页面上有多个 iScroll 元素

我正在使用 jQtouch 和 iScroll 制作一个移动网站我不想使用 iScroll 获得多个可滚动区域但只有列表可以使用 iScroll 我尝试过这个 var scroll1 scroll2 function loaded sc
Spark 抛出 java.util.NoSuchElementException：找不到密钥：67

在 Zeppelin 中运行 Spark 平分 kmmeans 算法 I transform my data using the TF IDF algorithm val idf new IDF minFreq fit data val h
在 Python OpenCV 4.2.0（2020 年）中使用 SIFT（或替代方案）

我正在尝试使用 SIFT 与 Python 进行特征检测但它不再是 OpenCV 的一部分orOpenCV 贡献使用 OpenCV opencv contrib python 两个版本 4 2 0 34 这个问题的最新版本我得到 gt
MPI_Bsend 的缺点？

我最近遇到了一个死锁我可以通过使用来解决MPI Bsend代替MPI Send 如果我理解正确的话 MPI Bsend 是一个非阻塞发送并且可以安全地修改我发送的内容而不必担心发送操作何时完成所以 double x 1 MPI Bs
在关闭之前的 AlertViewController 后呈现新的 AlertViewController - Swift

我试图在用户选择第一个 AlertViewController 中的操作后呈现新警报请在下面找到我的代码 IBAction func forgotPassword sender AnyObject 1 Create the alert c
Firestore 规则（判断真假）

在 firestore 中你可以有如下规则 service cloud firestore match databases database documents match products document allow read writ
在 C# 中将一组成员标记为私有/公共

在 C 类声明中您可以将一组成员标记为私有或公共例如 private int x double y 好像c 中没有办法做到这一点我错了吗不您不能在 C 中执行此操作最好的情况下你可以对成员使用默认的可见性即私有的而不是使用
为什么以及何时需要多个构建代理？

考虑 TFS 2010 的构建控制器拥有 1 个以上构建代理的能力由于构建对于团队环境来说是一个主观主题因此请考虑在提交签入时执行构建的环境每个项目集合将包含 10 多个团队项目但一天内可能只致力于其中 1 或 2 个 TFS
改造覆盖端点

我可以覆盖设置的端点路径吗RestAdapter建造者假设我有 20 个端点使用相同的基本 URL 但有 1 个端点不使用相同的基本 URL 我想调用 setEndpoint 供所有 20 个使用但在我需要使用不同基本 URL 的一种情
在有源的情况下使用 HTML 脚本标签进行编码

我注意到标签不允许您在其中使用 JavaScript 例如这不起作用也不会在 FireBug 中抛出错误为什么会发生这种情况为什么我们必须添加额外的
使 qhull/qvoronoi 将 Voronoi 限制为凸包或给定多边形

平面 Voronoi 曲面细分将始终具有无界多边形无限区域我如何告诉 qhull voronoi 将曲面细分与其中之一相交原始点的凸包或者带有我明确的多边形指定可能是一个矩形具体例子 https github com barr
如何在日期之间设置范围并且仅显示某些特定行

下面的代码工作正常请注意我有一个名为f3然后我就这么做了Output生成从以下位置获得的所有数据f3 一切都好但现在我的想法是在日期之间设定一个范围并且只指定一些特定的行Output appear Example 我想看看Time获
解析从请求发布中收到的多部分/表单数据

我正在使用请求库编写 Web 服务客户端我正在获取包含文件和文本 json 的 multipart form data 中的数据我不知道如何解析它是否有一个合适的库来解析 python 中的多部分表单数据格式或者我应该自己编写解析
在 Dockerfile 中使用“pyenv activate”

我正在尝试在 Dockerfile 中安装和设置 pyenv FROM nvidia cuda 8 0 cudnn5 devel ubuntu16 04 这是 Dockerfile 的后半部分前半部分只是安装依赖项 RUN useradd
iOS开发中如何彻底去除bundle id？

如何重复使用为应用程序 ID 创建的捆绑包 ID 我什至删除了关联的应用程序ID 但捆绑包ID仍然不可用是否说捆绑包ID一旦创建就无法完全删除捆绑包 ID 无法准确地重复使用例如com abc xxx只能使用一次如果您从一个帐户创建
如何在 Admin Silverstripe 中添加自定义按钮及其功能？

如何在 Admin Silverstripe 中添加自定义按钮及其功能请告诉我解决方案 Custom Button add only in one menu 就像评论中提到的 wmk一样您可以直接获取框架代码GridFieldPrint
Maven - maven-war-plugin 更改目标目录（webapp 除外）

我正在使用 springboot 但我不希望它在 maven war plugin 任务期间复制我的 webapp 文件夹因为它包含很多文件例如 Bower components 文件夹我正在使用 grunt 所以我在我的 war 中
Android 版 Googlemaps v2 中 getInfoWindow() 和 getInfoContents() 之间的区别

两个问题有什么区别public abstract View getInfoWindow Marker marker and public abstract View getInfoContents Marker marker getInf
TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？

我已将 embedding attention seq2seq 模块用于机器翻译任务如以下指定的教程中所述 https www tensorflow org versions master tutorials seq2seq index

TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？

TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？ 的相关文章

随机推荐

热门标签

TensorFlow embedding_attention_seq2seq 方法默认实现双向 RNN 编码器吗？的相关文章