如何在 TensorFlow 中构建一个带有循环的简单 RNN？

2023-12-19

我刚刚开始使用 TensorFlow，正在尝试实现一个非常简单的 RNN。 RNN 有x作为输入，y作为输出，仅由一个层组成，该层需要x并将之前的输出作为输入。这是我想到的事情的图片：

问题是，我看不到任何通过 TensorFlow API 构建包含循环的图的方法。每当我定义一个张量时，我都必须指定它的输入是什么，这意味着我必须已经定义了它的输入。所以这就存在先有鸡还是先有蛋的问题。

我什至不知道想要定义一个带有循环的图是否有意义（首先计算什么？我必须定义 softmax 节点的初始值吗？）。我尝试使用变量来表示先前的输出，然后手动获取值y并在每次输入训练样本后将其存储在变量中。但这会非常慢，除非有一种方法可以在图表本身中表示这个过程（？）。

我知道 TensorFlow 教程展示了 RNN 的示例实现，但他们作弊并从已经包含循环的库中提取了 LSTM 模块。总的来说，这些教程非常适合指导您如何构建某些东西，但它们可以更好地解释这个野兽的真正工作原理。

那么，TensorFlow 专家们，有没有办法构建这个东西呢？我该怎么做呢？

事实上，所有机器学习框架中的前向和后向传递都假设您的网络没有循环。实现循环网络的一种常见方法是及时将其展开几个步骤（例如 50 个步骤），从而将具有循环的网络转换为没有循环的网络。

例如，在您引用的文档中：

https://www.tensorflow.org/versions/r0.7/tutorials/recurrent/index.html https://www.tensorflow.org/versions/r0.7/tutorials/recurrent/index.html

他们提到

为了使学习过程易于处理，通常的做法是将反向传播的梯度截断为固定数量 (num_steps) 的展开步骤。

它实际上意味着他们将创造num_stepsLSTM 单元，其中每个单元都将值作为输入x对于当前时间步长，以及输出previousLSTM 模块。

The BasicLSTMCell他们使用的并且您认为有循环的实际上没有循环。 LSTM 单元只是单个 LSTM 步骤（具有两个输入 [输入和内存] 和两个输出 [输出和内存] 的块，并使用门根据输入计算输出）的实现，而不是整个 LSTM 网络。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

tensorflow

如何在 TensorFlow 中构建一个带有循环的简单 RNN？的相关文章

LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
卷积 ImageNet 网络对于翻转图像具有不变性

我正在使用深度学习 caffe 框架进行图像分类我有一些有头像的硬币有些是左向的有些是右向的为了对它们进行分类我使用常见的方法从预训练的 ImageNet 网络中获取权重和结构该网络已经捕获了大量图像模式并主要训练最后一层以
tensorflow：检查标量布尔张量是否为 True

我想使用占位符控制函数的执行但不断收到错误不允许使用 tf Tensor 作为 Python bool 这是产生此错误的代码 import tensorflow as tf def foo c if c print This is tr
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
在优化器期间保持变量不变

我有一个损失张量 L 的 TensorFlow 计算图它取决于 2 个 tf Variables A 和 B 我想在保持 B 固定的同时在变量 A 上运行梯度上升 A L 与 A 的梯度反之亦然在 B 上运行梯度上升 B L 与 B
如何在张量流中使用带有估计器的衰减学习率？

我正在尝试将 LinearClassifier 与具有衰减学习率的 GradientDescentOptimizer 一起使用 My code def main load data features np load data feature
卷积神经网络 (CNN) 输入形状

我是 CNN 的新手我有一个关于 CNN 的问题我对 CNN 特别是 Keras 的输入形状有点困惑我的数据是不同时隙的二维数据比方说10X10 因此我有 3D 数据我将把这些数据输入到我的模型中来预测即将到来的时间段所以我
提交用于 Tensorflow 对象检测的 Google Cloud ML 训练作业时出现错误消息

尝试提交 Tensorflow 对象检测任务的 Google Cloud ML 训练作业我正在遵循官方指南 https github com tensorflow models blob master research object de
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
Tensorflow：无法在 gradle 中解析

今天早上我打开 Android Studio 时 Gradle 尝试同步时出现以下错误 Error 103 13 Failed to resolve org tensorflow tensorflow android 按照他们的说明Gith
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
在 Tensorflow2 中将图冻结为 pb

我们通过图形冻结保存来自 TF1 的许多模型 tf train write graph self session graph def some path get graph definitions with weights output g
tf-models：official.vision.detection Mask-RCNN 无效参数：indices[1,63] = [1, -1] 未索引到参数形状 [2,100,112,112]

我正在尝试根据此处提供的官方 MaskRCNN 模型训练 Mask RCNN 模型张量流模型 https github com tensorflow models tree master official vision detectio
在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

我尝试编写一个基于深度网络的程序来读取手写数字我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
将tensorflow 2.0 BatchDataset转换为numpy数组

我有这个代码 train images test images tf keras datasets mnist load data train dataset tf data Dataset from tensor slices train
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1

随机推荐

不同回文子串的数量

给定一个字符串我知道如何找到回文子串的数量使用 Manacher 算法在线性时间内完成但现在我需要找到数量独特独特回文子串现在这可能会导致 O n n 2 算法一个 n 用于查找所有此类子字符串而 n 2 用于将这些子字符串中
SQLite 中的 CEIL 和 FLOOR

找到最干净的方法是什么ciel and floor中的一个数SQLite 不幸的是 SQLite 只有ROUND 功能 Formulas Ceil cast x as int x gt cast x as int 取x的整数部分如果小数值
FileReader.readAsBinaryString 返回二进制还是基于 ASCII 的字符集？

简而言之我想将图像的二进制数据发送到我的处理程序该处理程序将作为字节数组保存在数据库中使用读取文件输入的值在我的 Javascript 中我会得到如下输出 GIF89a 2c 3f Sma c T At X c 8 fj I Q q
如何在 React.js 中修改现有的 PDF？

我的反应状态数组中几乎没有值通过 props 传递给当前组件但我不想像下面的代码中当前显示的那样显示而是想使用文件系统中的 PDF 模板因此我的预期结果是能够在给定 x y 坐标的原始 PDF 副本上从状态文本或图像绘制给定数据
多行之间的 SQLite SUM()

我需要一些有关 Android 应用程序中的 SUM 功能的帮助我有一张如下所示的表我有需要SUM最后两条记录注释和最后一条带注释记录之间的数量我需要对第 31 32 行和 33 行的数量求和它将返回 90 我已经尝试过 SELEC
为什么我不能将匿名类型作为参数传递给函数？

我试图做类似下面的事情但它不起作用为什么 NET 不让我这样做 private void MyFunction var items whatever 从 Visual C 3 0 开始在方法作用域中声明的变量可以具有隐式类型 var
tfs 服务器上身份验证失败

我有一个非常奇怪的问题git bash在窗户上当我在 Visual Studio 中工作时使用存储在 tfs 服务器中的 git 存储库没有问题我只是分支承诺并推动但是当我尝试在我的系统中执行相同的操作获取拉动推送时git
Ionic PWA 部署

我正在尝试将 Ionic 2 项目的渐进式 Web 应用程序版本部署到 Heroku 但它似乎不起作用我正在尝试使用 Ionic build browser prod 然后部署 www 文件夹但我没有收到 Heroku 的任何响应似乎
ClickOnce 认为 Windows 更新 KB5029649 之后有可用更新，即使没有可用更新

你好 StackOverflow 社区我在使用 ClickOnce 部署的 VB NET 应用程序时遇到了一个不寻常的问题尽管没有发布任何最新更新我们的一些用户仍会被提示更新应用程序当他们继续进行时它的行为就像是全新安装一样会清
在 FormInput 组件下方反应本机元素行

我正在使用 React Native Elements 中的 FormInput 元素它似乎在每个 FormInput 组件下方生成一条线一个比另一个更微弱表格如下
在纯 NumPy 中重写 for 循环以减少执行时间

I 最近询问有关尝试优化科学应用程序的 Python 循环的问题 https stackoverflow com questions 2586749 what is the most platform and python version
现场（“点击”）和表演

我有一个网格有一列包含 a 带有一些附加信息的锚标记 a
如何在内存中创建文件供用户下载，而不是通过服务器？

有没有办法在客户端创建一个文本文件并提示用户下载它而无需与服务器进行任何交互我知道我不能直接写入他们的机器安全性和所有但我可以创建文件并提示他们保存它吗适用于 HTML5 浏览器的简单解决方案 function download f
PowerMock 何时新替代方案

我不想再使用 powermock 了因为junit5开始模拟静态类所以我试图摆脱 powermock 方法如您所知您可以使用whenNew关键字创建类的实例 Junit5中对于whenNew有什么替代方案吗这是我的代码的一部分 w
在 PowerShell 中创建临时目录？

PowerShell 5 引入了New TemporaryFile cmdlet https learn microsoft com en us powershell module microsoft powershell utility
多态性的真正意义（用途）是什么

我是面向对象编程的新手虽然我明白什么是多态但我无法得到它的真正用途我可以有不同名称的函数为什么我应该尝试在我的应用程序中实现多态性经典答案想象一个基类Shape 它暴露了一个GetArea方法想象一个Square类和一个Rec
安装 Android Wear 示例应用时失败 [INSTALL_FAILED_OLDER_SDK]

我按照以下说明进行操作这个链接 http developer android com training wearables apps creating html在 Android Studio 中创建一个简单的移动可穿戴应用程序但是在
斐波那契数的迭代算法

我对斐波那契数的迭代算法感兴趣所以我在 wiki 上找到了这个公式它看起来很简单所以我在 Python 中尝试了它它没有编译问题公式看起来正确不是确定为什么它给出错误的输出我没有正确实施它吗 def fib n if n 0
如何在pythonplot_surface中设置Z轴的比例等于X轴和Y轴

我尝试使用 matplotlib 中的plot surface 来绘制 3D 曲面我的代码是 fig plt figure ax fig gca projection 3d ax set aspect equal ax plot surf
如何在 TensorFlow 中构建一个带有循环的简单 RNN？

我刚刚开始使用 TensorFlow 正在尝试实现一个非常简单的 RNN RNN 有x作为输入 y作为输出仅由一个层组成该层需要x并将之前的输出作为输入这是我想到的事情的图片问题是我看不到任何通过 TensorFlow API 构

如何在 TensorFlow 中构建一个带有循环的简单 RNN？

如何在 TensorFlow 中构建一个带有循环的简单 RNN？ 的相关文章

随机推荐

热门标签

如何在 TensorFlow 中构建一个带有循环的简单 RNN？的相关文章