LSTM 批次与时间步

2024-05-10

我按照 TensorFlow RNN 教程创建了 LSTM 模型。然而，在这个过程中，我对“批次”和“时间步长”之间的差异（如果有的话）感到困惑，并且我希望得到帮助来澄清这个问题。

教程代码（见下文）本质上是根据指定数量的步骤创建“批次”：

with tf.variable_scope("RNN"):
      for time_step in range(num_steps):
        if time_step > 0: tf.get_variable_scope().reuse_variables()
        (cell_output, state) = cell(inputs[:, time_step, :], state)
        outputs.append(cell_output)

然而，以下似乎做了同样的事情：

    for epoch in range(5):
        print('----- Epoch', epoch, '-----')
        total_loss = 0
        for i in range(inputs_cnt // BATCH_SIZE):
            inputs_batch = train_inputs[i * BATCH_SIZE: (i + 1) * BATCH_SIZE]
            orders_batch = train_orders[i * BATCH_SIZE: (i + 1) * BATCH_SIZE]
            feed_dict = {story: inputs_batch, order: orders_batch}

            logits, xent, loss = sess.run([...], feed_dict=feed_dict)

假设您正在处理文本，BATCH_SIZE 将是您正在并行处理的句子数，num_steps 将是任何句子中的最大单词数。这些是 LSTM 输入的不同维度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

tensorflow

LSTM

LSTM 批次与时间步的相关文章

如何从图像生成 tiff/box 文件以在 Windows 中训练 Tesseract

我正在尝试在 Windows 中训练 Tesseract 为此我需要一对 tiff box 文件并且我正在尝试使用 jTessBoxEditor 创建它但它不接受图像作为输入我也尝试过 boxFactory 但它无法正常运行有谁知道
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
查找张量流运算所依赖的所有变量

有没有办法找到给定操作通常是损失所依赖的所有变量我想用它来将该集合传递到optimizer minimize or tf gradients 使用各种set intersection 组合到目前为止我已经找到了op op input
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
Caffe 多输入图像

我正在考虑实现一个 Caffe CNN 它接受两个输入图像和一个标签后来可能是其他数据并且想知道是否有人知道 prototxt 文件中执行此操作的正确语法它只是一个带有额外顶部的 IMAGE DATA 层吗或者我应该为每个层使用单独
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
使用xgboost进行分类时如何获得置信区间或预测离散度的度量？

使用xgboost进行分类时如何获得置信区间或预测离散度的度量例如如果 xgboost 预测某个事件的概率为 0 9 如何获得该概率的置信度这种置信度是否也被认为是异方差的要为 xgboost 模型生成置信区间您应该训练多个模型
使用预训练（Tensorflow）CNN 提取特征

深度学习已成功应用于多个大型数据集用于对少数类别猫狗汽车飞机等进行分类其性能优于 SIFT 特征袋颜色直方图等更简单的描述符然而训练这样的网络需要每个类别大量的数据和大量的训练时间然而在花时间设计和训练这样一种设备并
单词预测算法

我确信有一篇关于此问题的帖子但我找不到提出这个确切问题的帖子考虑以下我们有字典可供使用我们收到了许多单词段落我希望能够根据此输入预测句子中的下一个单词假设我们有几个句子例如你好我的名字是汤姆他的名字是杰瑞他去了没有水的
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
Keras 可以处理不同尺寸的输入图像吗？

Keras 可以处理不同尺寸的输入图像吗例如在全卷积神经网络中输入图像可以具有任意大小然而我们在用Keras创建网络时需要指定输入形状因此我们如何使用 Keras 来处理不同的输入尺寸而不将输入图像调整为相同的尺寸谢谢你的帮
在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

我尝试编写一个基于深度网络的程序来读取手写数字我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
期望最大化算法的数值示例[重复]

这个问题在这里已经有答案了由于我不确定给出的公式有人可以提供 EM 算法的简单数字示例吗一个非常简单的具有 4 或 5 个笛卡尔坐标的坐标就可以了那这个呢 http en wikibooks org wiki Data Mining
Keras 错误：预计会看到 1 个数组

当我尝试在 keras 中训练 MLP 模型时出现以下错误我使用的是 keras 版本1 2 2 检查模型输入时出错您输入的 Numpy 数组列表传递给您的模型的尺寸不是模型预期的尺寸预期的查看 1 个数组但得到以下 12859
使用 glmnet 纠正 n 个数据集上的 n 个 LASSO 回归的输出（严格来说是所选的特征/变量）

注意这是对上一个问题 https stackoverflow com questions 75006466 how to replicate my results from running n lassos iteratively usi

随机推荐

从 pod 安装库时出现错误

我收到未定义的方法squish for
oracle日期序列？

我有一个 oracle 数据库我需要一个包含 2 年所有日期的表例如来自01 01 2011 to 01 01 2013 首先我想到了一个序列但显然唯一支持的类型是数字所以现在我正在寻找一种有效的方法来做到这一点欢呼骗局如果您想
如何在javascript中设置从数据库输入的最大数量？

我希望根据数据库中的数量设置输入类型数字中输入的最大数量目前我正在尝试让它在数据最大的基础上工作然后再尝试从数据库中获取最大值但它似乎无法工作之前已经在这里问过但我仍然无法理解在 php javascript 中设置数据
MSBuild 未使用所有核心进行构建

我有一个使用 Visual Studios 2008 配置的项目当我打开 IDE 并点击构建时系统上的所有核心都用于构建该项目但是当我尝试从命令行构建时仅使用 1 个核心这是我正在运行的命令 C Windows Microsof
仅将非模态 QDialog 窗口放置在我的应用程序顶部，而不是所有应用程序顶部

我有一个 QDialog 窗口它应该始终位于我的应用程序顶部它不是模态的用户可以随时与对话框和主应用程序进行交互使用窗口保持在顶部提示在某种程度上实现了这一点但是该对话框仍然位于所有其他正在运行的应用程序例如记事本 chrom
MSBuild 能否从生成的 SetParameters.xml 中排除“隐藏”Web 部署参数？

In my 参数 xml文件中我有几个参数使用 Web 部署变量语法来引用其他参数就像这个引用IIS Web Application Name范围
如何缩放到高图中的特定点

Highmaps highcharts 是一个 javascript jquery 适配器可在浏览器等中呈现地图我有一张突出显示单个国家地区的地图但是世界地图的比例如此之大因此我想在将地图加载到相关国家地区后进行放大看看
PowerShell 与 MongoDB C# 驱动程序方法不兼容？

由 C 泛型引起的最新 MongoDB 驱动程序的问题 Cannot find an overload for GetCollection and the argument count 1 我可能可以使用其他没有泛型的 GetCollect
如何使用回形针对多页 pdf 进行缩略图

我想让 Paperclip 为上传的多页 PDF 文件的每一页创建 2 个缩略图我正在运行 Paperclip 2 3 1 1 并在我的资产模型中使用它 has attached file asset styles gt medium g
jQuery - xpath 查找？

如果您在 xml 中有下面的 xml 那么您会使用以下命令变得昏昏欲睡 xml find animal find dog find beagle text jQuery 中是否有类似的方法来使用 xpath xml xpathfind an
无法读取解析推送通知包数据

我尝试使用 Parse 推送通知服务发送自定义数据但从 Bundle 中提取时总是返回 null 值自定义广播接收器 Override public void onReceive Context context Intent inten
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
C# 从今天起 30 天

我需要我的应用程序从今天起 30 天后过期我会将当前日期存储在应用程序配置中如何检查应用程序是否已过期我不介意用户是否将时钟调回来并且应用程序可以正常工作用户太愚蠢而不会这样做 if appmode Trial string dat
将对象映射到 TableView 部分的 Swift 二维数组

我想不出更好的方法来做到这一点我将学生对象的所有属性映射到二维数组中所以我的电视有几个部分我也不能使用静态表视图如果是这样这个问题就不会存在所以我在 TVC 中的代码 let currentUser PFUser current
Escape String - 在 Javascript 中输出rails字符串[重复]

这个问题在这里已经有答案了我正在尝试将字符串值分配给 erb 文件中的 javascript 对象如下所示 var data name 问题是如果name is Tom s small ears 的输出data name将会Tom x
如何自动更新Android Studio？

我需要将 Android Studio 更新到 0 9 9 版本但是当我按下载在更新信息对话框上时它会将我发送到此处 http developer android com sdk index html http developer
ActionBar 中的进度条

我正在使用一个应用程序它将在应用程序内部加载一个网站现在我想在操作栏中添加一个进度栏而无需向上滑动来抑制功能像那样我在用Fragment在我的应用程序中 WebviewFragment public class WebviewFr
在 python 查询参数中使用 %20 而不是 + 作为空格

我使用 python requests 编写了以下 python 脚本 http requests readthedocs org en latest http requests readthedocs org en latest impo
SpaCy 中的自定义句子边界检测

我正在尝试在 spaCy 中编写一个自定义句子分段器它将整个文档作为单个句子返回我编写了一个自定义管道组件它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi

LSTM 批次与时间步

LSTM 批次与时间步 的相关文章

随机推荐

热门标签

LSTM 批次与时间步的相关文章