如何保持火车步骤之间的状态？

2023-12-27

我的计算图中有一个张量，我想在每个训练步骤之后添加一行。我怎样才能做到这一点？

更详细：我正在获取渐变optimizer.compute_gradients，我想根据渐变历史修改这些渐变。这是我尝试使用的代码：

def process_gradient(gradient, optimizer, name):
  reshaped_gradient = flatten(gradient)

  if gradient.name in optimizer._slots:
    optimizer._slots[gradient.name] += [reshaped_gradient]
  else:
    optimizer._slots[gradient.name] = [reshaped_gradient]

  # each 
  gradients_over_time = tf.stack(optimizer._slots[gradient.name])

  print('gradients_over_time.get_shape()', gradients_over_time.get_shape())

  return gradient

...

grads_and_vars = optimizer.compute_gradients(cost_function)
train_step = optimizer.apply_gradients([(process_gradient(grad, optimizer, str(i)), var) for i, (grad, var) in enumerate(grads_and_vars)])

我还尝试保留一个变量，用于通过连接新行来跟踪行，但这不起作用。

我最终使用了tf.py_func来实现这一点。我在 Python 函数中访问的全局列表中跟踪状态。这里应用了渐变：

# process each individual gradient before applying it
train_step = optimizer.apply_gradients([(process_gradient(grad, str(i)), var) for i, (grad, var) in enumerate(grads_and_vars)])

这是我随着时间的推移跟踪状态的地方，并将使用构建的状态：

def construct_processor(name):
  global_gradients_over_time = {}

  def python_process_gradient(gradient):
    reshaped_gradient = gradient.flatten()

    if name in global_gradients_over_time:
      global_gradients_over_time[name].append(reshaped_gradient)
    else:
      global_gradients_over_time[name] = [reshaped_gradient]

    # process gradients somehow

    return gradient

  return python_process_gradient

def process_gradient(gradient, name):
  return tf.py_func(construct_processor(name), [gradient], tf.float32)

construct_processor只是允许您一次处理一个渐变，为每组渐变命名，以便我可以在全局字典中找到它们。我认为，这种方法还可以使内存远离 GPU。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

如何保持火车步骤之间的状态？的相关文章

在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
使用两个图像的平方差作为张量流中的损失函数

我正在尝试使用两个图像之间的 SSD 作为我的网络的损失函数 h fc2 is my output layer y is my label image ssd tf reduce sum tf square y h fc2 train st
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
如何在 Windows 上的 Python 2.7 上安装 Tensorflow？

我尝试通过 pip 安装 TensorFlow pip install tensorflow 但是得到这个错误找不到满足tensorflow要求的版本来自版本这个问题有解决办法吗我还是想通过pip安装如果您只因为 Keras 而需
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
使用 TensorFlow 2.1 的 Cloud TPU v3 Pod 的 TPUClusterResolver 出现错误

我正在尝试在带有 TensorFlow 2 1 的 Google Cloud Compute Engine VM 上使用我的抢占式 Cloud TPU v3 256 但它似乎无法正常工作TPUClusterResolver抛出一个Coul
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
如何在google colab中降级到tensorflow-gpu版本1.12

我正在运行一个仅与旧版本的tensorflow GPU兼容的GAN 因此我需要将google colab中的tensorflow gpu从1 15降级到1 12 我尝试使用本中建议的以下命令thread https stackoverflo
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut

随机推荐

您需要使用不同的包名称，因为“com.example”受到限制

我已经在这里找到了很多关于这个问题的线程但没有一个对我有用我使用的是Android Studio 2 1 2 并且我仍然有com example域名在清单或任何其他文件中更改它会导致出现大量错误而我的 build gradle 仅显
SwiftUI：两指滑动（滚动）手势

我对 2 指滑动滚动手势感兴趣不是两指拖动而是两指滑动无需按下就像在 Safari 中用来向上和向下滚动一样据我所知没有一个基本手势可以用于此目的 TapGesture 不是 LongPressGesture 不 DragG
防止多次登录

我试图在我的应用程序中阻止同一用户的多次登录我的想法是在用户登录时更新安全标记并将其添加为声明然后在每个请求中将 cookie 中的标记与数据库中的标记进行比较这就是我的实现方式 public virtual async Task
滚动条没有出现？

我正在为 Tumblr 开发主题但由于某种原因滚动条没有出现这是博客的网址 http infinitethemedewitt tumblr com 主题的代码可以通过右键单击在页面源代码中找到除了 html 之外的所有代码因为它被
fopen 不显示内容

不知道为什么我的即时通讯页面出现空白 txt 中有数据 php 中没有错误这是 txt Product txt ID OID Title Description Option Price 01 01JAP Japanese Mod
CarrierWave + RMagick 方形裁剪？

我正在尝试使用 Ruby on Rails CarrierWave 和 RMagick 制作固定的方形图像裁剪我尝试过以下两种方法但没有运气 version thumb do process resize to fit gt 200 2
C# 十进制格式化查询

我正在尝试格式化小数以便它显示如下 14 5 应显示为 14 50 14 50 应显示为 14 50 14 05 应显示为 14 05 14 00 应显示为 14 是否可以使用单一字符串格式即不使用条件格式我尝试过 0 不满足第一个示
水平滚动列表

我希望将图像显示在水平列表中这就是我到目前为止所做的 var list Ext create Ext List store store itemTpl new Ext XTemplate img src icon inline true
设置解析注册的默认个人资料图片

我试图在注册时在解析中设置默认的个人资料图片该图片位于我的项目文件夹中有什么办法可以设置不上传照片吗 var user new Parse User user set username username val user set pas
在 HyperLedger Composer 查询中获取资产计数？

我想在 HyperLedger Composer 中编写一个查询返回我在超级账本中拥有的资产数量我有数千条记录我不想将它们全部获取并计算计数数据传输会很慢我希望查询返回计数不幸的是这儿没有count使用作曲家查询语言您必须创
cocos2d 计算给定起点、角度和距离的目的地点

我想快点吧 Cocos2d 和 xcode 中的 2d 问题 I have CGPoint currPoint float lineLength float angle 现在我需要找到距离 currPoint 角度为 lineLength
大量数据的数据库设计[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在开展一个项目涉及来自美味网站的大量数据可用数据为日期用户 ID 网址标签针对每个书签我将数据库规范化为 3NF 并且由于我们
是否需要“设置字符集utf8”？

我正在重写我们的数据库类基于 PDO 并陷入困境我被教导要同时使用SET NAMES utf8 and SET CHARACTER SET utf8在 PHP 和 MySQL 中使用 UTF 8 时在 PDO 中我现在想使用PDO M
PHP 日期比较

如何检查 2008 02 16 12 59 57 格式的日期是否小于 24 小时前 if strtotime 2008 02 16 12 59 57 gt time 24 60 60 LESS
如何确定 _POSIX_PATH_MAX 的系统值

谁能告诉我如何找到系统值 POSIX PATH MAX在 Linux 薄荷中我知道它在文件中可用但我不知道如何找到它的值根据 POSIX 要使用的工具被命名为getconf http pubs opengroup org onlin
React Router Lazy 组件不起作用

所以这有效 import Page from components Page render return
有选择地将 C++ 核心逻辑暴露给 QML 的最佳方法

我想设置特定 QML 组件的上下文属性而不是在根上下文中我不希望在组件外部访问该属性 C 有没有一种方法可以访问组件的上下文只允许从组件的上下文中访问命名属性而不是从全局命名空间中访问我想保持 QML 声明性而不是在 C 中创建
Seaborn 群图和点图躲避对齐

有没有办法将点图的平均值 SEM 与相应的群图对齐这是我的代码 import seaborn as sns import numpy as np import pandas as pd import matplotlib pyplot a
如何在pyspark中自动删除常量列？

我在 pyspark 中有一个 Spark 数据框我需要从数据框中删除所有常量列由于我不知道哪些列是常量因此我无法手动取消选择常量列即我需要一个自动过程我很惊讶我无法在 stackoverflow 上找到简单的解决方案 Examp
如何保持火车步骤之间的状态？

我的计算图中有一个张量我想在每个训练步骤之后添加一行我怎样才能做到这一点更详细我正在获取渐变optimizer compute gradients 我想根据渐变历史修改这些渐变这是我尝试使用的代码 def process grad

如何保持火车步骤之间的状态？

如何保持火车步骤之间的状态？ 的相关文章

随机推荐

热门标签

如何保持火车步骤之间的状态？的相关文章