如何创建具有动态“zero_state”的dynamic_rnn（推理失败）

2024-02-10

我一直在使用“dynamic_rnn”来创建模型。

该模型基于 80 个时间周期信号，我想在每次运行之前将“initial_state”归零，因此我设置了以下代码片段来完成此操作：

state = cell_L1.zero_state(self.BatchSize,Xinputs.dtype)
outputs, outState = rnn.dynamic_rnn(cell_L1,Xinputs,initial_state=state,  dtype=tf.float32)

这对于训练过程非常有用。问题是，一旦我进行推理，我的 BatchSize = 1，我就会收到错误，因为 rnn“状态”与新的 Xinputs 形状不匹配。所以我想我需要根据输入批量大小制作“self.BatchSize”，而不是对其进行硬编码。我尝试了很多不同的方法，但没有一个有效。我宁愿不通过 feed_dict 传递一堆零，因为它是基于批量大小的常量。

以下是我的一些尝试。它们通常都会失败，因为构建图表时输入大小未知：

state = cell_L1.zero_state(Xinputs.get_shape()[0],Xinputs.dtype)

.....

state = tf.zeros([Xinputs.get_shape()[0], self.state_size], Xinputs.dtype, name="RnnInitializer")

另一种方法，认为初始化程序可能直到运行时才会被调用，但在图形构建时仍然失败：

init = lambda shape, dtype: np.zeros(*shape)
state = tf.get_variable("state", shape=[Xinputs.get_shape()[0], self.state_size],initializer=init)

有没有办法动态创建这个恒定的初始状态，或者我是否需要使用张量服务代码通过 feed_dict 重置它？有没有一种聪明的方法可以在图表中仅使用 tf.Variable.assign 执行一次此操作？

问题的解决方案是如何获取“batch_size”，使得变量不被硬编码。

这是给定示例中的正确方法：

Xinputs = tf.placeholder(tf.int32, (None, self.sequence_size, self.num_params), name="input")
state = cell_L1.zero_state(Xinputs.get_shape()[0],Xinputs.dtype)

问题是使用“get_shape()[0]”，它返回张量的“形状”并采用[0]处的batch_size值。文档似乎不太清楚，但这似乎是一个常量值，因此当您将图加载到推理中时，该值仍然是硬编码的（可能仅在图创建时评估？）。

使用“tf.shape()”函数，似乎可以解决问题。这不会返回形状，而是返回张量。所以这似乎在运行时更新得更多。使用此代码片段解决了 128 个批次的训练问题，然后将图加载到仅处理 1 个批次的 TensorFlow-Service 推理中。

Xinputs = tf.placeholder(tf.int32, (None, self.sequence_size, self.num_params), name="input")
batch_size = tf.shape(Xinputs)[0]
state = self.cell_L1.zero_state(batch_size,Xinputs.dtype)

这是 TensorFlow FAQ 的一个很好的链接，它描述了这种方法'如何构建适用于可变批量大小的图表？': https://www.tensorflow.org/resources/faq https://www.tensorflow.org/resources/faq

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowserving

如何创建具有动态“zero_state”的dynamic_rnn（推理失败）的相关文章

错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
TensorFlow HVX 加速支持

我成功构建并运行了测试应用程序https github com tensorflow tensorflow tree master tensorflow contrib hvx https github com tensorflow ten
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
AttributeError：模块“tensorflow.python.summary.summary”没有属性“FileWriter”

我收到此错误尽管我到处都看过file writer tf summary FileWriter path to logs sess graph 被提到为正确的实施this https github com tensorflow tenso
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train
在c++中的嵌入式python中导入tensorflow时出错

我的问题是关于在 C 程序中嵌入 Python 3 5 解释器以从 C 接收图像并将其用作我训练的张量流模型的输入当我在 python 代码中导入tensorflow库时出现错误其他库工作正常简化后的代码如下 include
如何修复 Tensorflow 中的“ValueError：操作数无法与形状 (2592,) (4,) 一起广播”？

我目前正在设计一个 NoisyNet 层如下所示探索嘈杂的网络 https arxiv org abs 1706 10295 在 Tensorflow 中并得到如标题所示的维度误差而两个张量的维度将在行中按元素相乘filtered o
TensorFlow：使用不同的输入张量重新运行网络？

假设我在 TensorFlow 中有一个典型的 CNN 模型 def inference images images 4D tensor of batch size IMAGE SIZE IMAGE SIZE 3 size conv 1 c
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
Tensorflow：无法在 gradle 中解析

今天早上我打开 Android Studio 时 Gradle 尝试同步时出现以下错误 Error 103 13 Failed to resolve org tensorflow tensorflow android 按照他们的说明Gith
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
如何在 TensorFlow 中访问原型中的值？

我从tutorial https www tensorflow org extend tool developers 我们可以这样做 for node in tf get default graph as graph def node pr
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
sigmoid激活函数可以用来解决Keras中的回归问题吗？

我已经用 R 实现了简单的神经网络但这是我第一次用 Keras 实现所以希望得到一些建议我在 Keras 中开发了一个神经网络函数来预测汽车销量数据集可用here https github com allmydatasets dat
在 Tensorflow2 中将图冻结为 pb

我们通过图形冻结保存来自 TF1 的许多模型 tf train write graph self session graph def some path get graph definitions with weights output g
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行

随机推荐

Angular 2路由器没有设置基本href

我收到错误但找不到原因这是错误 EXCEPTION Error during instantiation of LocationStrategy RouterOutlet gt Router gt Location gt Locatio
访问 Azure 网站中的特定文件位置（c:/folder/file）

一家公司向我提供了一个包含许多文件的 dll dll使用这种路径访问文件 C folder file config 我正在通过专用服务器开发 IIS 8 但我想将该项目迁移到 Windows Azure 上我知道 Windows Azur
Spring MVC：在视图中包含 JSP（JSP 安装在视图旁边，因此无法从外部控制器访问）？

我已经创建了一个视图并且它运行良好但我现在需要在页面内包含另一个 JSP 考虑到我的视图安装在 WEB INF Views 的受保护区域中因此它在我的 imgs css 所在的资源目录中不可用我尝试过使用它总是给我 FileNotF
T4 获取解决方案的当前工作目录

我在 Visual Studio 2010 中使用 T4 并且想要迭代解决方案中的文件但是我发现 T4 源代码生成在一种沙箱中工作并且当前工作目录位于 Visual Studio 10 目录内在程序文件中有没有一种方法可以相对论地引用
与关注者|朋友用户的自引用关系

为了建立用户之间的关系创建了一个如下所示的表 sql CREATE TABLE friends from INT NOT NULL to INT NOT NULL UNIQUE INDEX from to 你可能知道领域from and
是否可以通过其他方式增加 google colab 中的内存？

当我在 google colab 中运行此代码时 n 100000000 i while True i append n 10 66 这种事经常发生在我身上我的数据量很大在达到 12 72 GB RAM 后但我没有立即看到崩溃提示和增
如何使用spring boot制作通用库

现在我想为我们的系统开发一个通用的邮件服务当我们设计时我们希望开发一个RabbitMQ生产者和消费者在消费者方面我们可以开发和部署Spring Boot or Spring Cloud应用程序但在生产者方面我们希望提供一个通用的
如何使用 Code::Blocks 链接到库？

C GUI 教程对 TextOut 的未定义引用 https stackoverflow com questions 2180755 c gui tutorial undefined reference to textout 218078
boto3 upload_file 方法中支持对象级别标记

我想在将文件上传到 S3 时为其添加标签 Boto3 支持使用 put object 方法指定标签但是考虑到预期的文件大小我使用 upload file 函数来处理分段上传但此函数拒绝标记作为关键字参数 import boto3
JellyBean 中的 RecognitionListener 如果不立即对话就会冻结

我正在开发的一个基于语音识别的应用程序可以在从 API 8 Android 2 2 开始的所有 Android 版本上运行良好但在 Nexus S 4G Android 4 1 1 上 RecognitionListener 将简单地暂停
iPhone XR / XS / XS Max CSS 媒体查询

用于定位 Apple 2018 设备 iPhone XR XS XS Max 的正确 CSS 媒体查询是什么 iPhone XR 1792x828px at 326ppi media only screen and device width
Warden 回调应该放置在 Rails 应用程序中的什么位置？

我对 Rails 比较陌生我已设置 Devise 并希望在用户登录后运行一些回调代码看着典狱长维基页面 https github com hassox warden wiki Callbacks 我可以使用 after set user
增加 Windows Mobile 5 模拟器存储

我正在使用 Microsoft Sync Framework 将 SQL Server 数据库与 Windows Mobile 5 模拟器上的 SQL Compact SDF 文件同步我们部署的实际设备中有一个 2 GB SD 卡因此我
在 post 方法中隐藏表单操作 url

我下面有这段代码我想将其插入新脚本中
Android 风格 Intent Activity

如何根据口味创建活动意图等级制度 main ActivityA flavor free uses main ActivityA flavor paid uses own paid ActivityA 那么如何根据当前的风味创建一个Inte
检查 iPhone 中的网络可达性后应用程序崩溃？

我有一个 mpmovieplayercontroller 来播放在线音乐和 avaudiosesion 在后台播放相同的音乐当第一次应用程序在没有网络访问的情况下启动时通常我显示没有互联网连接当我在连接到互联网并播放后尝试时显示错误
如何创建具有视觉源安全的 diff 文件？

如果我想用svn创建一个目录的补丁文件我需要做的就是右键单击该目录单击tortoiseSVN 然后单击创建补丁我就有了一个很好的补丁文件其中包含了最新版本的差异svn 上的代码和我机器上的代码有没有办法构建隐藏在 VSS 中的 d
从历史任务中获取表单密钥

我们从任务服务获取表单密钥就像下面的代码片段一样 for Task task getTaskService createTaskQuery taskCandidateGroupIn candidateGroup initializeFor
iMessage 扩展和应用内购买

我正在尝试使用 InApp Purchase 功能创建 iMessage 扩展基本上我创建了一个 iMessage 应用程序它创建了两个目标您的应用程序目标消息扩展并且每个都有它自己的包标识符扩展名有 app 前缀现在我正在尝
如何创建具有动态“zero_state”的dynamic_rnn（推理失败）

我一直在使用 dynamic rnn 来创建模型该模型基于 80 个时间周期信号我想在每次运行之前将 initial state 归零因此我设置了以下代码片段来完成此操作 state cell L1 zero state self B

如何创建具有动态“zero_state”的dynamic_rnn（推理失败）

如何创建具有动态“zero_state”的dynamic_rnn（推理失败） 的相关文章

随机推荐

热门标签

如何创建具有动态“zero_state”的dynamic_rnn（推理失败）的相关文章