如何在自定义 TF2.4 训练循环中使用指数移动平均线

2024-03-06

我有一个自定义训练循环，可以简化如下

inputs = tf.keras.Input(dtype=tf.float32, shape=(None, None, 3))
model = tf.keras.Model({"inputs": inputs}, {"loss": f(inputs)})
optimizer = tf.keras.optimizers.SGD(learning_rate=0.1, momentum=0.9, nesterov=True)

for inputs in batches:
    with tf.GradientTape() as tape:
        results = model(inputs, training=True)
    grads = tape.gradient(results["loss"], model.trainable_weights)
    optimizer.apply_gradients(zip(grads, model.trainable_weights))

The ExponentialMovingAverage 的 TensorFlow 文档 https://www.tensorflow.org/api_docs/python/tf/train/ExponentialMovingAverage不清楚应该如何使用它从头开始训练循环 https://www.tensorflow.org/guide/keras/writing_a_training_loop_from_scratch。有人用过这个吗？

此外，如果影子变量仍然在内存中，应该如何将影子变量恢复到模型中，以及如何检查训练变量是否已正确更新？

在训练循环之前创建 EMA 对象：

ema = tf.train.ExponentialMovingAverage(decay=0.9999)

然后在优化步骤后应用 EMA。 ema 对象将保留模型变量的影子变量。（您不需要致电tf.control_dependencies在这里，请参阅注释中的文档 https://www.tensorflow.org/api_docs/python/tf/control_dependencies)

optimizer.apply_gradients(zip(grads, model.trainable_variables))
ema.apply(model.trainable_variables)

然后，在模型中使用影子变量的一种方法可能是通过调用将影子变量分配给模型的变量averageEMA 对象的方法：

for var in model.trainable_variables:
    var.assign(ema.average(var))
model.save("model_with_shadow_variables.h5")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflow20

如何在自定义 TF2.4 训练循环中使用指数移动平均线的相关文章

如何在 Tensorflow 中计算 R^2

我正在尝试在 Tensorflow 中进行回归我不确定我计算 R 2 是否正确因为 Tensorflow 给出的答案与sklearn metrics r2 score有人可以看看我下面的代码让我知道我是否正确地实现了图中的方程谢谢
tf.data.Dataset 迭代器返回 Tensor("IteratorGetNext:1", shape=(None, 16), dtype=int32) 但无法获取张量的值

我正在尝试编写一个自定义模型其中我正在编写一个自定义train step功能我正在从自定义数据生成器创建 tf data Dataset 例如 tds tf data Dataset from generator tdg iter ar
张量流中是否存在无操作（传递）操作？

正如标题所示我想利用这样的操作来重命名节点并更好地组织图表或者是否有其他推荐的做法来重命名图中的现有节点谢谢有tf no op https www tensorflow org api docs python tf no op它允许
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av
为什么在线预测失败并显示“无法从 feed 中获取元素作为字节”？

在线预测失败并显示无法从源中获取字节形式的元素这是什么意思以及如何解决它我使用以下代码生成预测 request data examples pickup longitude 73 885262 pickup latitude 40
Keras 中的 model.fit() 和 model.evaluate() 有什么区别？

我使用 Keras 和 TensorFlow 后端来训练 CNN 模型之间是什么model fit and model evaluate 我应该最好使用哪一种我在用model fit 截至目前我知道的用处model fit and m
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
如何查找冻结模型的输入和输出节点

我想使用张量流optimize for inference py来自模型动物园的冷冻模型的脚本 ssd mobilenet v1 coco 如何查找确定模型的输入名称和输出名称雇用张量板生成的图的版本 https i stack img
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
无法满足显式设备规范“/device:GPU:0”，因为没有匹配的设备

我想在我的 Ubuntu 14 04 机器上使用 TensorFlow 0 12 作为 GPU 但是当将设备分配给节点时我收到以下错误 InvalidArgumentError see above for traceback Canno
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl

随机推荐

React：如何对渲染的组件的变化进行动画处理？

我更改了通过时间间隔呈现的组件我希望能够在每次发生变化时添加动画最好的方法是什么 constructor props super props this state currentComponent 1 numberOfComponent
将服务引用添加到 WP8 应用程序时出现问题

我尝试添加服务引用http www webservicex com globalweather asmx WSDL网络服务我转到添加服务引用它发现它很好但是当我尝试单击确定时出现错误无法签出当前文件该文件可能是只读的或锁定
JavaFX并发任务设置状态

我正在为我的应用程序创建 UI 该应用程序与其他平台的版本共享核心模块在JavaFX中我尝试使用Task http docs oracle com javafx 2 api javafx concurrent Task htmls 在后
PHP 基于当前文件路径动态包含

我想找到一种方法来包含基于当前文件路径的一些文件例如我有 website com templates name1 index php 这个 index php应该是一个独特的文件我将在不同深度的许多不同目录中使用它所以我想让代码通用
如何使用数字字符实体而不是问号将 XmlDocument.Save() 编码为“us-ascii”？

我的目标是获得一个二进制缓冲区 MemoryStream ToArray 会产生byte 在本例中的 XML 且不会丢失 Unicode 字符我希望 XML 序列化程序使用数字字符引用来表示任何在 ASCII 中无效的内容到目前为止
在node-sqlite3中使用Gyp中的共享库

我是吉普新手我不想编译我的依赖项而是想使用共享库特别是我的计算机上已有的 libsqlite3 so 主要的 binding gyp 目前看起来像 targets target name node sqlite3 sources sr
国际键盘上常用字符的键码

好的从特殊符号捕获按键代码会在不同布局的键盘上产生不同的结果但是像 a z 这样的常见字符呢如果您有 QWERTY 键盘您将获得按键代码81当你输入时q 当您拥有 AZERTY 键盘时您会获得代码吗81当你按a since a
在 HttpModule 中重写 URL 时如何使波形符 (~) 运算符起作用？

我在用重写路径 http msdn microsoft com en us library 1kz7fdx9 aspx in an IHttpModule 路由到子 Web 应用程序如以下 IIS 布局所示例如当请求根布莱赫进来
修改并重新编译Android SDK

我知道Android中实现的一些方法和一些类没有导出到Android公共SDK中我已经能够通过编译我的应用程序并将其放置在 Android 树中来创建一个使用其中一些功能的应用程序是否可以通过从源代码重新编译这些函数来将其导出到 And
如何将一个数组输入与另一个数组输入关联起来？

假设我有 2 个扫描仪填充的阵列 name and age 每一项都按顺序填写如果我要找到数组中最年长的人如何使用数组打印出他们的名字和年龄例如最大的条目age was 78 有没有办法将其与name 数组来打印它参考代码 publ
当元素有多个类时，jquery 按特定类查找元素

所以我正在做一些后端团队在构建时没有经过深思熟虑的事情这给我留下了一个充满 div 的文档我正在做的是从我需要单击的元素回滚获取父容器然后在父容器中找到一个元素class alert box warn class alert box
在自定义损失函数中重塑张量

我有一个类似的问题这个问题 https stackoverflow com questions 43056512 reshape tensorflow tensor inside keras loss function 我正在尝试在 ker
使用 WorkflowServiceHost 进行 WF4 工作流版本控制

相关这个问题 https stackoverflow com questions 2064518 loading persisted workflow after workflowdefinition has changed in wf4
Android：ListAdapter 示例重绘相同内容

我使用此示例中的 ListAdapter http code google com p au optimizing layouts 201 source browse au optimizinglayouts src com example
显示在 SQL Management Studio (2008) 中为表创建命令

我刚刚开始使用 SQL Management Studio 我想知道是否可以显示现有表的创建命令我已经能够在 Oracle SQL Developer 中做到这一点我试图问 google 叔叔但可能只使用过错误的搜索命令无论如何有
背景图像路径在 CSS 中不起作用

相对路径在 CSS 中不起作用尽管它是正确的 width 64px background url images abc xyz bottom navigation jpg no repeat 0 0 萤火虫给出这个错误 Folder pa
Django内连接查询

我正在使用 django 很难掌握如何进行复杂的查询这是我的模型 class TankJournal models Model user models ForeignKey User tank models ForeignKey Tank
如何取消目标c中的本地单个通知

你能帮我看看如何在 iOS 10 中取消本地通知吗 UNUserNotificationCenter center UNUserNotificationCenter currentNotificationCenter center remo
反序列化动态 XML

The XML下面总是采用这种格式但是下面的元素
如何在自定义 TF2.4 训练循环中使用指数移动平均线

我有一个自定义训练循环可以简化如下 inputs tf keras Input dtype tf float32 shape None None 3 model tf keras Model inputs inputs loss f in

如何在自定义 TF2.4 训练循环中使用指数移动平均线

如何在自定义 TF2.4 训练循环中使用指数移动平均线 的相关文章

随机推荐

热门标签

如何在自定义 TF2.4 训练循环中使用指数移动平均线的相关文章