当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？

2024-01-10

我写了一个使用 TensorFlow 的 RNN 语言模型 https://github.com/wpm/tfrnnlm。该模型被实现为RNN班级。图结构是在构造函数中构建的，而RNN.train and RNN.test方法运行它。

当我移动到训练集中的新文档时，或者当我想在训练期间运行验证集时，我希望能够重置 RNN 状态。我通过管理训练循环内的状态，通过提要字典将其传递到图中来实现这一点。

在构造函数中我像这样定义了 RNN

    cell = tf.nn.rnn_cell.LSTMCell(hidden_units)
    rnn_layers = tf.nn.rnn_cell.MultiRNNCell([cell] * layers)
    self.reset_state = rnn_layers.zero_state(batch_size, dtype=tf.float32)
    self.state = tf.placeholder(tf.float32, self.reset_state.get_shape(), "state")
    self.outputs, self.next_state = tf.nn.dynamic_rnn(rnn_layers, self.embedded_input, time_major=True,
                                                  initial_state=self.state)

训练循环看起来像这样

 for document in document:
     state = session.run(self.reset_state)
     for x, y in document:
          _, state = session.run([self.train_step, self.next_state], 
                                 feed_dict={self.x:x, self.y:y, self.state:state})

x and y是文档中的批量训练数据。我的想法是，我在每批之后传递最新的状态，除非我开始一个新文档，当我通过运行将状态清零时self.reset_state.

这一切都有效。现在我想更改我的 RNN 以使用推荐的state_is_tuple=True。但是，我不知道如何通过 feed 字典传递更复杂的 LSTM 状态对象。我也不知道要传递什么参数self.state = tf.placeholder(...)我的构造函数中的行。

这里正确的策略是什么？仍然没有太多示例代码或文档dynamic_rnn可用的。

TensorFlow 问题2695 https://github.com/tensorflow/tensorflow/issues/2695 and 2838 https://github.com/tensorflow/tensorflow/issues/2838显得相关。

A 博客文章 http://www.wildml.com/2016/08/rnns-in-tensorflow-a-practical-guide-and-undocumented-features/on WILDML 解决了这些问题，但没有直接阐明答案。

也可以看看TensorFlow：记住下一批的 LSTM 状态（有状态 LSTM） https://stackoverflow.com/questions/38241410/tensorflow-remember-lstm-state-for-next-batch-stateful-lstm.

Tensorflow 占位符的一个问题是你只能使用 Python 列表或 Numpy 数组来提供它（我认为）。因此，您无法将运行之间的状态保存在 LSTMStateTuple 的元组中。

我通过将状态保存在这样的张量中解决了这个问题

initial_state = np.zeros((num_layers, 2, batch_size, state_size))

LSTM 层中有两个组件，细胞状态 and 隐藏状态，这就是“2”的由来。（这篇文章很棒：https://arxiv.org/pdf/1506.00019.pdf https://arxiv.org/pdf/1506.00019.pdf)

构建图表时，您可以解压并创建元组状态，如下所示：

state_placeholder = tf.placeholder(tf.float32, [num_layers, 2, batch_size, state_size])
l = tf.unpack(state_placeholder, axis=0)
rnn_tuple_state = tuple(
         [tf.nn.rnn_cell.LSTMStateTuple(l[idx][0],l[idx][1])
          for idx in range(num_layers)]
)

然后你按照通常的方式得到新的状态

cell = tf.nn.rnn_cell.LSTMCell(state_size, state_is_tuple=True)
cell = tf.nn.rnn_cell.MultiRNNCell([cell] * num_layers, state_is_tuple=True)

outputs, state = tf.nn.dynamic_rnn(cell, series_batch_input, initial_state=rnn_tuple_state)

事情不应该是这样的……也许他们正在研究解决方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？的相关文章

python 可以检测它运行在哪个操作系统下吗？

python 可以检测操作系统然后为文件系统构建 if else 语句吗我需要将 Fn 字符串中的 C CobaltRCX 替换为 FileSys 字符串 import os path csv from time import strf
替换字符串列表中的 \x00 的最佳方法？

我有一个来自已解析 PE 文件的值列表其中包括 x00每个部分末尾的空字节我希望能够删除 x00字符串中的字节而不删除所有字节 x 文件中的 s 我试过做 replace and re sub 但并没有取得太大成功使用Python 2
Python 中的六边形自组织映射

我在寻找六边形自组织映射 http en wikipedia org wiki Self organizing map在Python上准备好模块如果存在的话绘制六边形单元格的方法将六边形单元作为数组或其他方式使用的算法 About
用 Python 编写一个无操作或虚拟类

假设我有这样的代码 foo fooFactory create 由于种种原因 fooFactory create 可能无法创建实例Foo 如果可以的话我想要fooFactory create 返回一个虚拟无操作对象这个对象应该是完全惰性
Python：当前目录是否自动包含在路径中？

Python 3 4 通过阅读其他一些 SO 问题似乎如果moduleName py文件位于当前目录之外如果要导入它必须将其添加到路径中sys path insert 0 path to application app folder
Python3 查找 2 个列表中有多少个差异才能相等

假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到其中有多少项list2应该改变以便它等于lis
将一个时间序列插入到 pandas 中的另一个时间序列中

我有一组定期测量的值说 import pandas as pd import numpy as np rng pd date range 2013 01 01 periods 12 freq H data pd Series np ran
使用 glmnet 纠正 n 个数据集上的 n 个 LASSO 回归的输出（严格来说是所选的特征/变量）

注意这是对上一个问题 https stackoverflow com questions 75006466 how to replicate my results from running n lassos iteratively usi
如何为多组精灵创建随机位置？

我尝试使用 blit 和 draw 方法进行 for 循环并为 PlayerSprite 和 Treegroup 使用不同的变量 for PlayerSprite in Treegroup surface blit PlayerSprit
字典中列表中仅有的几个索引的总和

如果我有这种类型的字典 a dictionary dog white 3 5 black 6 7 Brown 23 1 cat gray 5 6 brown 4 9 bird blue 3 5 green 1 2 yellow 4 9 mo
ValueError：无法插入 ID，已存在

我有这个数据 ID TIME 1 2 1 4 1 2 2 3 我想按以下方式对数据进行分组ID并计算每组的平均时间和规模 ID MEAN TIME COUNT 1 2 67 3 2 3 00 1 如果我运行此代码则会收到错误 ValueE
在谷歌Colab中使用cv2.imshow()

我正在尝试通过输入视频来对视频进行对象检测 cap cv2 VideoCapture video3 mp4 在处理部分之后我想使用实时对象检测来显示视频 while True ret image np cap read Expand di
Python Flask 是否定义了路由顺序？

在我看来我的设置类似于以下内容 app route test def test app route
在pycharm中调试python代码

这个问题类似于this https stackoverflow com questions 10240018 how to use pycharm to debug python script一我正在尝试调试pyethapp https
asyncio - 多次等待协程（周期性任务）

我正在尝试为异步事件循环创建定期任务如下所示但是我收到 RuntimeError 无法重用已等待的协程异常显然 asyncio 不允许等待相同的可等待函数如中讨论的这个错误线程 https bugs python org issu
CSV 在列中查找最大值并附加新数据

大约两个小时前我问了一个关于从网站读取和写入数据的问题从那时起我花了最后两个小时试图找到一种方法来从输出的 A 列读取最大日期值将该值与刷新的网站数据进行比较并将任何新数据附加到 csv 文件而不覆盖旧的或创建重复项目前 100
如何在单独的文件中使用 FastAPI Depends 作为端点/路由？

我在单独的文件中定义了一个 Websocket 端点例如 from starlette endpoints import WebSocketEndpoint from connection service import Connectio
如何对字符串列表进行排序？

在 Python 中创建按字母顺序排序的列表的最佳方法是什么基本回答 mylist b C A mylist sort 这会修改您的原始列表即就地排序要获取列表的排序副本而不更改原始列表请使用sorted http docs pyt
将 Scikit-Learn OneHotEncoder 与 Pandas DataFrame 结合使用

我正在尝试使用 Scikit Learn 的 OneHotEncoder 将 Pandas DataFrame 中包含字符串的列替换为 one hot 编码的等效项我的下面的代码不起作用 from sklearn preprocessin
如何使用 Django (Python) 登录表单？

我在 Django 中构建了一个登录表单现在我遇到了路由问题当我选择登录按钮时表单不会发送正确的遮阳篷我认为前端的表单无法从查看 py 文件所以它不会发送任何 awnser 并且登录过程无法工作该表单是一个简单的静态 html

随机推荐

如何设置环境变量 TF_Keras = 1 进行 onnx 转换？

最近更新到tensorflow 2 0 但在将我的 h5 模型转换为 onnx 时遇到问题曾经是一个非常简单的过程但现在我遇到了问题当我运行以下代码时 onnx testing import onnx import keras2onn
Sass math.div 函数在 Angular 应用程序中未定义，但在 Angular lib 中定义

我需要使用Sass math div https sass lang com documentation modules math div在我的角度应用程序中运行这是我的 SCSS 代码示例 use sass math div min h
Kendo Grid 与 Bootstrap 下拉菜单或工具提示配合不佳

我正在尝试在 Kendo Grid 中使用某些 Bootstrap 元素例如 Bootstrap 下拉按钮和工具提示问题是下拉菜单或工具提示始终位于下方或上方行的下方我尝试调整显示元素的 z index 但这并不能解决问题有没有人设
data.table 到底什么时候保留列名？

有些 J 表达式保留列名称有些则不保留 library data table d data table hello 1 d hello hello 1 1 d c hello V1 1 1 d hello hello 1 1 d 1 he
如何在nestedScrollView中使用viewpager并在viewpager的顶部查看

由于viewpager 我无法滚动nestedScrollView 所以让我在这里解释一下我想要创建的布局设计 NestedScrollView 内部有 FrameLayout 和带有选项卡布局的 viewpager Viewpager 使
从 mongodb 数组中查找最小值和最大值

我有以下项目集合 Project Collection Id 1 name p1 tasks taskId t1 startDate ISODate 2018 09 24T10 02 49 403Z endDate ISODate 2018
Spark/Scala 将 Oracle 表加载到 Hive

我正在将几个 Oracle 表加载到 Hive 它似乎正常工作但有 2 个表出现错误 IllegalArgumentException requirement failed Decimal precision 136 exceeds ma
检查给定 pid 的进程是否存在

给定 Linux 进程的 pid 我想从 C 程序检查该进程是否仍在运行 Issue a kill 2 http linux die net man 2 kill系统调用0作为信号如果调用成功则说明存在该pid的进程如果呼叫失败并且e
不阻塞地读取 Socket 中可用的内容

我正在服务器上工作该服务器读取客户端发送的数据但大小未知我也无法更改客户端发送的大小我想从客户端读取数据直到它阻塞并等待服务器的响应我尝试使用available 它有时会起作用但有时即使流中有一些数据它也只是返回零 whil
如何使用 Oracle Sql Loader 用当前时间戳填充时间戳字段

我正在使用 SQL Loader 读取一个管道分隔文件并希望在我正在填充的表中填充 LAST UPDATED 字段我的控制文件如下所示 LOAD DATA INFILE SampleFile dat REPLACE INTO TABLE
在 django 中获取 10 天前的数据库表数据

我正在尝试检索 10 天之前的数据来更新该字段数据目前我的模型就像 class Restaurant models Model is approved models BooleanField null False default Fals
OpenCV中基于HOG特征的SVM分类器用于“对象检测”

我有一个项目我想检测图像中的物体我的目标是使用 HOG 功能通过使用 OpenCV SVM 实现我可以找到用于检测人的代码并且我阅读了一些关于调整参数以检测对象而不是人的论文不幸的是由于一些原因我无法做到这一点首先我可能错
调用 vscode 扩展从 webview 获取数据

我有一个列表必须从扩展程序返回到我的 webview 页面的输入框就像 web 视图中存在的 javascript 事件必须调用列表的扩展然后使用该列表对象并在视图中显示列表数据我该怎么做呢 WebView 类有一个向 WebVie
AWS Glue 爬网程序无法提取 CSV 标头

我已经无计可施了我有 15 个 csv 文件它们是通过直线查询生成的例如 beeline u CONN STR outputformat dsv e SELECT gt data csv I chose dsv因为某些字符串字段包含逗
是否可以使用递归下降解析器来验证语法并同时构建解析树？

是否可以在使用递归下降解析器检查数据是否符合语法的同时生成解析树如果是这样当我递归下降时我将使用什么方法来构建一棵树谢谢博达西多注意我是解析新手已经问了几个关于SO的问题我正在变得更好是的这是可能的如何执行此操作取
AngularJS - 如何从控制器内部更改状态

我是 AngularJS 的新手想知道如何从控制器内更改状态例如我通常会在单击按钮时更改状态
等待子线程完成：Java

问题描述 Step 1 在主线程中从用户处获取输入 FILE NAME Step 2 对该文件执行 10 次操作即计数字符计数行等并且所有这 10 次操作必须在单独的线程中进行这意味着必须有 10 个子线程 Step 3 主线程等待
删除 DOM 元素是否会删除关联的范围？

在 Angular 中范围与 DOM 元素相关联如果你打电话 element remove does element scope destroy 最后也被打电话了还是开发人员自己负责清理范围这让我认为删除 DOM 元素应该自动删除范
如何在 HiveContext 中设置 hive.metastore.warehouse.dir ？

我正在尝试编写一个依赖于的单元测试用例DataFrame saveAsTable 因为它由文件系统支持我将 hive 仓库参数指向本地磁盘位置 sql sql s SET hive metastore warehouse dir file
当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？

我写了一个使用 TensorFlow 的 RNN 语言模型 https github com wpm tfrnnlm 该模型被实现为RNN班级图结构是在构造函数中构建的而RNN train and RNN test方法运行它当我移动到

当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？

当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？ 的相关文章

随机推荐

热门标签

当 state_is_tuple=True 时如何设置 TensorFlow RNN 状态？的相关文章