在张量流中多次运行 train op

2023-11-23

我有一些相当大的批量大小，我想对其采取多个梯度步骤。虽然我可以使用 python for 循环轻松完成此操作，但我想可能有一种更有效的方法，不需要在每次迭代时将数据传输到 GPU。我曾多次尝试将火车操作放入获取列表中，但我不确定它实际上是否运行了多次（运行时完全相同）。

如果您有可变大小的批处理，那么变量不适合保存它，您可以在之间保留此数据run使用持久张量进行调用。这是一个玩具示例

t = tf.int32
params = tf.Variable(tf.ones_initializer((), dtype=dt))
data_batches = [[1], [2, 3], [4, 5, 6]]

# op that uploads data to TF and saves it as a persistent Tensor
data_saver_placeholder = tf.placeholder(dt)
tensor_handle_op = tf.get_session_handle(data_saver_placeholder)

data_placeholder, data = tf.get_session_tensor(dt)
train_op = tf.assign_add(params, tf.reduce_prod(data)) 
init_op = tf.initialize_all_variables()
sess = tf.Session()
sess.run(init_op)

for batch in data_batches:
    # upload tensor to TF runtime and save its handle
    tensor_handle = sess.run(tensor_handle_op, feed_dict={data_saver_placeholder: batch})
    # run train op several times reusing same data
    for i in range(3):
        sess.run(train_op, feed_dict={data_placeholder: tensor_handle.handle})


assert sess.run(params) == 382

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

在张量流中多次运行 train op 的相关文章

在 Tensorflow 中每行选择一个元素的优雅方法

Given 一个矩阵A形状的 m n 张量I形状的 m 我想要一份清单J的元素来自A where J i A i I i 那是 I保存要从每行中选择的元素的索引A 背景我已经有了argmax A 1 现在我也想要max 我知道我可以使用r
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat
在按顺序读取的多个特征文件上训练 Keras 模型以节省内存

当我尝试读取大量功能文件时我遇到了内存问题见下文我想我应该分割训练文件并按顺序读取它们做到这一点的最佳方法是什么 x train np load path features x train npy y train np load p
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
让 TensorFlow 在 ARM Mac 上使用 GPU

我已经安装了TensorFlow在 M1 上 ARM Mac 根据这些说明 https github com apple tensorflow macos issues 153 一切正常然而模型训练正在进行CPU 如何将培训切换到GPU
稍微不同的形状会收敛到错误的数字 - 为什么？

我试图弄清楚为什么 TensorFlow 会做一些令人惊讶的事情我将其归结为一个测试用例尝试对一个简单的问题进行线性回归该问题只需将两个输入加在一起权重收敛到 1 0 偏差收敛到 0 0 正如它们应该的那样使用此版本的训练输出 t
卷积神经网络 (CNN) 输入形状

我是 CNN 的新手我有一个关于 CNN 的问题我对 CNN 特别是 Keras 的输入形状有点困惑我的数据是不同时隙的二维数据比方说10X10 因此我有 3D 数据我将把这些数据输入到我的模型中来预测即将到来的时间段所以我
TensorFlow：使用不同的输入张量重新运行网络？

假设我在 TensorFlow 中有一个典型的 CNN 模型 def inference images images 4D tensor of batch size IMAGE SIZE IMAGE SIZE 3 size conv 1 c
窗口多维 Tensorflow 数据集

我有形状的二维数据m by n我想要的窗口大小w沿着第一个轴进入数据集m w许多二维数组每个数组的大小w by n 例如如果数据是 0 1 2 3 4 5 6 7 8 9 10 11 然后我想将其窗口化 0 1 2 3 4 5 6 7 8
Tensorflow“feed_dict”：对键值对使用相同的符号得到“TypeError：无法将 feed_dict 键解释为张量”

我正在使用构建线性回归的 Tensorflow 示例我的代码如下 import numpy as np import tensorflow as tf train X np asarray 3 3 4 4 5 5 6 71 6 93 4
查找张量流运算所依赖的所有变量

有没有办法找到给定操作通常是损失所依赖的所有变量我想用它来将该集合传递到optimizer minimize or tf gradients 使用各种set intersection 组合到目前为止我已经找到了op op input
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
如何在 TensorFlow 中访问原型中的值？

我从tutorial https www tensorflow org extend tool developers 我们可以这样做 for node in tf get default graph as graph def node pr
如何使用 tf.nn.top_k 返回的索引对多维张量进行排序？

我有两个多维张量a and b 我想按以下值对它们进行排序a I found tf nn top k https www tensorflow org versions r1 0 api docs python nn evaluation
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
Colab 上没有名为“tensorflow.compat.v2”的模块

我正在关注这个https thebinarynotes com how to train mask r cnn on the custom dataset https thebinarynotes com how to train mask
在张量流中对不平衡数据集进行二次采样

张量流初学者在这里这是我的第一个项目我正在使用预定义的估算器我有一个极其不平衡的数据集其中积极结果大约占总数据的 0 1 我怀疑这种不平衡会极大地影响我的模型的性能作为解决这个问题的第一次尝试由于我有大量数据我想扔掉大部分底片
L-BFGS 是否有 tf.keras.optimizers 实现？

有人有 L BFGS 算法的 Tensorflow 2 tf keras 子类吗如果想使用 L BFGS 目前有两个官方选项 TF概率 SciPy 优化这两个选项使用起来相当麻烦尤其是在使用自定义模型时因此我计划实现 tf k

随机推荐

Lambda + Python + 退出代码

我遇到了用 Python 编写的简单 AWS Lambda 函数的问题当我运行 Lambda 函数时我的代码按预期运行结果正确但仍以错误代码退出代码结束 Process exited before completing requ
如何从文本框中删除光标？

这是我的代码 table tr td td tr table
Numpy - 将行添加到数组

如何向 numpy 数组添加行我有一个数组A A array 0 1 2 0 2 0 如果 X 中每行的第一个元素满足特定条件我希望从另一个数组 X 向该数组添加行 Numpy 数组没有像列表那样的追加方法或者看起来是这样如果
如何使用javascript检查页面是否是第一次加载

我想检查页面是否是第一次加载如果是则显示过滤器如果我将 showFiltermenu 放在 pageLoad 函数中那么每次加载页面时它都会显示但我只想它第一次显示我尝试使用Page IsPostBack但不显示过滤器
在 Ruby 中抓取/解析 Google 搜索结果

假设我有 Google 搜索结果页面的完整 HTML 有谁知道任何现有的代码 Ruby 来抓取解析Google搜索结果的第一页理想情况下它可以处理可能出现在任何地方的购物结果和视频结果部分如果没有那么基于 Ruby 的最佳屏幕抓取
Visual Studio Code 抱怨它“找不到 *.d.ts 文件中定义的类型的命名空间”

我使用创建了一个新项目吞咽角Yeoman 生成器语言设置为 TypeScript 然后运行Gulp构建过程并在网络浏览器中打开页面所有这些都正常运行没有任何更大的问题我只需要更换ref master in the tsd json
Android：同时进行平移和旋转动画

我想以编程方式同时显示两个动画而不是在 XML 文件中它应该旋转和平移我怎样才能做到这一点请给我一些建议这是妈妈的代码 gt ImageView snowImg1 ImageView findViewById R id snowim
如何在 QPlainTextEdit 中为突出显示的字符串创建工具提示

我有一个 QPlainTextEdit 并且其中突出显示了一些单词现在我希望当我用鼠标悬停在它上面时它会向我显示一个工具提示其中包含有关此突出显示单词的描述或类似内容在 QT IDE 中类似这样但我不知道如何开始这个所以任何想法
可变长度与 Malloc 数组

根据c99标准我们可以编写以下代码这是完全合法的 int x scanf d x int ar x 我的问题是如果我可以分配这样的数组为什么我需要 malloc 再次分配可变大小的数组另外您能否解释一下可变长度数组分配是如何发生
如何将具有历史记录的 SVN 存储库迁移到新的 Git 存储库？

我阅读了 Git 手册常见问题解答 Git SVN 速成课程等它们都解释了这个那个但你找不到像这样的简单说明 SVN 存储库位于 svn myserver path to svn repos Git 存储库位于 git myserve
类定义之外不允许覆盖

我创建了一个抽象类和一个具体子类 bca h include
在 ASP.NET MVC 4 中获取复选框值

我正在开发 ASP NET MVC 4 应用程序这个应用程序有一个基本的形式我的表单的模型如下所示 public class MyModel public string Name get set public bool Remember
模板的编译是如何工作的？

我正在读一本关于模板如何工作的书但我很难理解模板的解释 It says 当编译器看到模板的定义时它不会生成代码仅当我们实例化模板的特定实例时它才会生成代码事实上只有当我们使用模板时而不是在定义模板时才会生成代码这一事实会影
如何使用 ADO.NET 获取表中列的 SqlDbType？

我试图在运行时确定 sql server 表列的 SqlDbType 是什么是否有一个类可以在 System Data SqlClient 中执行此操作或者我应该自己进行映射我可以从那里得到一个字符串表示 SELECT DATA TY
像 360 全景一样自动捕捉图像

我正在开发类似于全景应用程序的应用程序我想当设备从左向右移动时自动捕获图像就像 360 全景应用程序一样经过一些研究我发现Sensor线程对此很有用我已经看到了一些传感器的例子here但我无法理解如何使用传感器来达到我的目的我也
错误 ITMS-9000：“签名缺失或无效。

错误 ITMS 9000 签名丢失或无效捆绑包路径 Payload My app name app GooglePlus bundle 处的捆绑包 com google GPPSignIn3PResources 未使用 Apple 提交证
将 Grails 应用程序转换为插件

我通过 grails create app 启动了一个 grails 应用程序为了模块化我觉得组件最好是一个插件我可以将此应用程序转换为 grails 插件吗谢谢巴布我从未根据之前编写的应用程序创建过插件但查看了Grails
为什么浮动 div 和非浮动 div 的顺序仅在某些情况下才重要？

我有类似的问题CSS 自动边距压低其他元素右侧浮动侧边栏被推到主非浮动内容 div 下方这answer建议的工作只需颠倒标记的顺序并写出浮动 divbefore非浮动 div 例如这个 div class container div
如何向数组添加新元素？

我有以下代码 String where where append ContactsContract Contacts HAS PHONE NUMBER 1 where append ContactsContract Contacts IN
在张量流中多次运行 train op

我有一些相当大的批量大小我想对其采取多个梯度步骤虽然我可以使用 python for 循环轻松完成此操作但我想可能有一种更有效的方法不需要在每次迭代时将数据传输到 GPU 我曾多次尝试将火车操作放入获取列表中但我不确定它实际上是否

在张量流中多次运行 train op

在张量流中多次运行 train op 的相关文章

随机推荐

热门标签