Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？

2024-03-29

默认情况下，函数dynamic_rnn仅输出隐藏状态（称为m）对于每个时间点可以通过如下方式获得：

cell = tf.contrib.rnn.LSTMCell(100)
rnn_outputs, _ = tf.nn.dynamic_rnn(cell,
                                   inputs=inputs,
                                   sequence_length=sequence_lengths,
                                   dtype=tf.float32)

有没有办法获得中间（不是最终）细胞状态（c）此外？

A tensorflow贡献者mentions https://github.com/tensorflow/tensorflow/pull/9995#issuecomment-343641550可以使用单元格包装器来完成：

class Wrapper(tf.nn.rnn_cell.RNNCell):
  def __init__(self, inner_cell):
     super(Wrapper, self).__init__()
     self._inner_cell = inner_cell
  @property
  def state_size(self):
     return self._inner_cell.state_size
  @property
  def output_size(self):
    return (self._inner_cell.state_size, self._inner_cell.output_size)
  def call(self, input, state)
    output, next_state = self._inner_cell(input, state)
    emit_output = (next_state, output)
    return emit_output, next_state

然而，它似乎不起作用。有任何想法吗？

建议的解决方案对我有用，但是Layer.call方法规范更通用，因此以下Wrapper应该对 API 更改更加稳健。你这个：

class Wrapper(tf.nn.rnn_cell.RNNCell):
  def __init__(self, inner_cell):
     super(Wrapper, self).__init__()
     self._inner_cell = inner_cell

  @property
  def state_size(self):
     return self._inner_cell.state_size

  @property
  def output_size(self):
    return (self._inner_cell.state_size, self._inner_cell.output_size)

  def call(self, input, *args, **kwargs):
    output, next_state = self._inner_cell(input, *args, **kwargs)
    emit_output = (next_state, output)
    return emit_output, next_state

这是测试：

n_steps = 2
n_inputs = 3
n_neurons = 5

X = tf.placeholder(dtype=tf.float32, shape=[None, n_steps, n_inputs])
basic_cell = Wrapper(tf.nn.rnn_cell.LSTMCell(num_units=n_neurons, state_is_tuple=False))
outputs, states = tf.nn.dynamic_rnn(basic_cell, X, dtype=tf.float32)
print(outputs, states)

X_batch = np.array([
  # t = 0      t = 1
  [[0, 1, 2], [9, 8, 7]], # instance 0
  [[3, 4, 5], [0, 0, 0]], # instance 1
  [[6, 7, 8], [6, 5, 4]], # instance 2
  [[9, 0, 1], [3, 2, 1]], # instance 3
])

with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())
  outputs_val = outputs[0].eval(feed_dict={X: X_batch})
  print(outputs_val)

回outputs是元组(?, 2, 10) and (?, 2, 5)张量，都是 LSTM 状态和输出。请注意，我使用的是“毕业”版本LSTMCell, from tf.nn.rnn_cell包，不tf.contrib.rnn。另请注意state_is_tuple=True以避免处理LSTMStateTuple.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

tensorflow

LSTM

recurrentneuralnetwork

Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？的相关文章

如何在后台运行python程序以保持活动窗口相同

我编写了一个程序可以将前景窗口更改为显示器尺寸的 85 并且要成功运行前景窗口需要保持不变我已将 python 脚本 pyw 放入批处理文件运行 pythonw 并在桌面上创建了批处理文件的快捷方式并提供了快速运行它的快捷方式我
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
如何使用Python在没有窗口的情况下在屏幕上显示文本

问题我需要在没有窗口的情况下直接将文本写入屏幕文本需要显示在所有其他窗口和全屏应用程序之上并且不应以任何方式单击或交互 Example The text doesn t need to have a transparent backg
SQLAlchemy+pymysql 错误：sqlalchemy.util.queue.Empty

尝试使用 Eclispse 在 Ubuntu 上运行 Python 2 SQLAlchemy 0 8 和 MySQL5 2 但我不断收到以下错误我使用 pymysql 实际上是 pymysql3 引擎模块监视器 from sqlalch
Scrapy 仅抓取每个页面的第一个结果

我目前正在尝试运行以下代码但它只保留每个页面的第一个结果知道可能是什么问题吗 from scrapy contrib spiders import CrawlSpider Rule from scrapy contrib linkext
Flask-Mail - 基于 Flask-Cookiecutter 异步发送电子邮件

我的烧瓶项目基于烧瓶饼干切割机 https github com sloria cookiecutter flask我需要异步发送电子邮件发送电子邮件的功能由以下配置米格尔的教程 https blog miguelgrinberg com
如何在海龟图形中将多个按键绑定在一起？

我正在尝试制作一个连接点的 python 游戏我希望游戏记录 2 次按钮按下操作示例如果用户按向上和向右箭头键乌龟将向东北方向移动 45 度这是我的代码 import turtle flynn turtle Turtle win
如何从分组数据创建直方图

我正在尝试根据 pandas 中的分组数据创建直方图到目前为止我已经能够创建标准线图但我不知道如何做同样的事情来获取直方图条形图我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图看看年龄分布是否存在差异来源数据 ht
python 没有名为serial的模块

我的 python 程序有问题我编写了程序来将数据温度从 arduino 获取到我的树莓派 sqlite 数据库但它在第 4 行导入串行处给了我一个错误提示 ImportError 没有名为串行的模块我使用 python3
构建一个简单的解析器，能够使用 PyParse 解析不同的日期格式

我正在构建一个简单的解析器它接受如下查询显示 fizi 从 2010 年 1 月 1 日到 2006 年 2 月 11 日的提交到目前为止我有 class QueryParser object def parser self stmn
用于 OAuth 身份验证的 WSGI 中间件

我使用构建了一个非常小的网络应用程序Flask http flask pocoo org 现在我想向网站添加非常基本的身份验证我不需要授权由于 Flask 不支持开箱即用的 auth auth 我想插入 WSGI 中间件来完成这项工作
为什么类型提示“float”接受“int”，而它甚至不是子类？

一方面我了解到数字可以int or float应将类型注释为float 来源 PEP 484 类型提示 https www python org dev peps pep 0484 the numeric tower and 这个计算器问
Python range() 和 zip() 对象类型

我了解功能如何range and zip 可以在 for 循环中使用然而我期望range 输出一个列表很像seq在 Unix shell 中如果我运行以下代码 a range 10 print a 输出是range 10 表明它不是一
在python中打开带有重音符号的文本文件

我尝试使用 Python 2 7 打开法语文本文件我使用了命令 f open textfr r 但是当我使用 f read 我失去了重音字符我明白了u J xc3 xa9tais xc3 xa0巴黎而不是J tais 巴黎等当在lin
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
为什么你可以在字符串上重载 __radd__ 而不是 __rmod__ ？

在Python中您可以覆盖右和左加法运算符
如何配置应用程序中的所有记录器

Python 的日志记录模块允许模块或类定义自己的记录器不同的记录器可以有不同的处理程序其中一些可能选择记录到文件而另一些则选择记录到标准输出现在我的应用程序使用其中几个模块每个模块都有自己的记录器这些记录器具有各种处理程序
梯度下降有哪些替代方案？

梯度下降存在局部极小值问题我们需要运行梯度下降指数次来找到全局最小值谁能告诉我梯度下降的任何替代方案及其优缺点 Thanks See 我的硕士论文 https arxiv org pdf 1707 09725 pdf page 96对于
ValueError：对于optimize.curve_fit中所需的数组来说对象太深

我正在尝试拟合化学系统中四个变量 A B C D 的人口增长和衰退的动力学模型我正在尝试求解以下一组方程我已将其以矩阵形式附加方程的矩阵形式 https i stack imgur com ysEdZ png 其中 t 是时间步长 k
类型提示：解决循环依赖

以下产生NameError name Client is not defined 我该如何解决 class Server def register client self client Client pass class Client de

随机推荐

DbContext AutoDetectChangesEnabled 设置为 false 检测更改

我有点难住了根据我读到的设置DbContext AutoDetectChangesEnabled to false应该禁用需要调用的更改跟踪DbContext DetectChanges为了识别要发送到数据库的更改但是从下面的日志可以
Aria2 不重新下载文件

我正在使用 aria2 下载动态生成的文件列表我希望它跳过下载目录中已有的文件但它没有这样做而是重新下载它们并添加一个 1到文件名我尝试使用 check integrity true 但这并没有改变行为有没有办法让它跳过已经存在的
检查所有复选框jquery

为什么我的js代码中可以一键点击name check all检查所有复选框 HTML div div
我应该使用哪个 Apple 推送通知服务 Java 库？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我需要使用 Java 服务器将推送通知发送到 iOS 设备Apple 推送通知服务 APNS http
ui-router 中 templateUrl 从一种状态动态更改为另一种状态

html a target blank t name a 上面的代码位于 ng repeat 中其中许多模板链接加载了名称和 id 因此当我单击每个链接时 href 将更新并将 id 号附加到所选模板链接我使用相同的控制器生成大约十个
当 html 属性和 css 样式的功能重叠时

1 如果在CSS文件中我们指定以下样式 td text align center 在 Html 文件中我们有 td align left 那么 CSS 文件中设置的值将优先于内联 html 属性因此其中包含的元素 td 单元格将与中心对齐
如何将 package.json 中的所有 npm 依赖项记录到 README.md 中

我想记录所有 npmdevDependencies and dependencies中描述的package json文件到README md文件在同一个项目中以下属性值得关注name description and version 当然
React-Vega 和 React-Vega 工具提示

我在用着react vega lite 官方给出的例子 https vega github io vega lite https vega github io vega lite https vega github io react veg
Anaconda ImportError：/usr/lib64/libstdc++.so.6：找不到版本“GLIBCXX_3.4.21”

当我尝试在 conda 环境中运行 Python 脚本时出现以下导入错误 squad azada scholar fe00 Desktop Toy Problem Team 2 python3 train py Traceback mos
将任何文件转换为二进制文件，反之亦然

我在 StackOverFlow 网站和互联网上搜索了这个问题及其相关问题但仍然没有得到明确的答案我想知道我可以使用什么软件将任何文件关于大小转换为包含此特定文件的零和一仅的文本文件然后将包含这些零和一的文本文件转换回原始文件
如何在不使用 POJO 的情况下利用 Spring Batch？

I know BeanWrapperFieldSetMapper类取决于 POJO 但事情是这样的如果我想利用 Spring Batch 功能但不想创建单独的作业不想编写 POJO 和单独的读取器写入或映射器该怎么办我的要求是读取
如何制作滚动条占位符

我的问题是浏览器窗口垂直滚动条被删除例如overflow hidden 稍后再次出现时会使页面跳转我使用 jQuery 从访问者中删除滚动选项同时运行脚本并将页面滚动到特定点然后使其再次重新出现当滚动条不存在时我可以为滚动条创建
ES 可从curl 访问，但不能从Marvel/Sense 访问

我已经沉浸在 Elastic Search 中 2 个小时了我用 Marvel 成功安装了 ES 使用marvel agent enabled false在 config elasticsearch yml 中并且能够从 Sense 发
使用 commons-exec 流式输出？

谁能给我一个例子来说明如何流式传输外部程序的输出DefaultExecutor 我没有找到任何描述如何执行此操作的文档我的外部进程将运行几个小时因此仅获取所有输出数据是不可行的它必须被流式传输注意此解决方案是同步的因此它不会流式
如何将 bugzilla 中的版本迁移到 redmine 中新的自定义“源版本”字段（我需要什么 SQL 语法）？

我正在将 bugzilla 安装迁移到 redmine 在 bugzilla 中错误总是根据导致问题出现的软件版本进行记录由于 redmine 支持路线图我想做一些迁移的事情我想做的第一部分是将所有当前版本设置移至新的自定义源版本
Powershell相当于Linux：ls -al [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我不经常使用 Powershell 或 Linux 所以我不确定 ls al 在 Powershell 术语中是什么我试图找到一些东西
部署在代理后面的 springdoc-openapi-ui (Swagger UI) 中的“生成的服务器 url”错误

带有 springdoc openapi ui Swagger UI 的 Spring Boot 2 2 应用程序运行 HTTP 端口该应用程序部署到 Kubernetes 并通过 Ingress 将 HTTPS 请求从集群外部路由到服务
如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

我正在做一个长文本分类任务文档中有超过 10000 个单词我计划使用 Bert 作为段落编码器然后将段落的嵌入逐步输入 BiLSTM 网络如下输入 batch size max paragraph len max tokens pe
来自 Drawable 的 AndEngine 纹理

我是 AndEngine 的新手由于某种原因我必须从 Drawable 变量创建一个 TextureRegion 不知道可不可以但我的代码不起作用 public class DrawableTextureSource implemen
Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？

默认情况下函数dynamic rnn仅输出隐藏状态称为m 对于每个时间点可以通过如下方式获得 cell tf contrib rnn LSTMCell 100 rnn outputs tf nn dynamic rnn cell inp

Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？

Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？ 的相关文章

随机推荐

热门标签

Tensorflow：如何使用dynamic_rnn从LSTMCell获取中间细胞状态（c）？的相关文章