计算复合损失函数各部分的梯度范数

2024-04-26

假设我有以下损失函数：

loss_a = tf.reduce_mean(my_loss_fn(model_output, targets))
loss_b = tf.reduce_mean(my_other_loss_fn(model_output, targets))
loss_final = loss_a + tf.multiply(alpha, loss_b)

可视化梯度范数loss_final可以这样做：

optimizer = tf.train.AdamOptimizer(learning_rate=0.001)
grads_and_vars = optimizer.compute_gradients(loss_final)
grads, _ = list(zip(*grads_and_vars))
norms = tf.global_norm(grads)
gradnorm_s = tf.summary.scalar('gradient norm', norms)
train_op = optimizer.apply_gradients(grads_and_vars, name='train_op')

但是，我想绘制梯度的范数loss_a and loss_b分别地。我怎样才能在最有效率的方式？我需要打电话吗compute_gradients(..)双方loss_a and loss_b分别，然后将这两个梯度添加在一起，然后将它们传递给optimizer.apply_gradients(..)？我知道由于求和规则，这在数学上是正确的，但它看起来有点麻烦，而且我也不知道如何正确实现梯度求和。还，loss_final很简单，因为它只是一个求和。如果什么loss_final更复杂，例如一个部门？

我正在使用张量流0.12。

你是对的，组合渐变可能会变得混乱。相反，只需计算每个损失的梯度以及最终损失。因为张量流优化了有向无环图 (DAG) https://stackoverflow.com/questions/2283757/can-someone-explain-in-simple-terms-to-me-what-a-directed-acyclic-graph-is在编译之前，这不会导致重复工作。

例如：

import tensorflow as tf

with tf.name_scope('inputs'):
    W = tf.Variable(dtype=tf.float32, initial_value=tf.random_normal((4, 1), dtype=tf.float32), name='W')
    x = tf.random_uniform((6, 4), dtype=tf.float32, name='x')

with tf.name_scope('outputs'):
    y = tf.matmul(x, W, name='y')

def my_loss_fn(output, targets, name):
    return tf.reduce_mean(tf.abs(output - targets), name=name)

def my_other_loss_fn(output, targets, name):
    return tf.sqrt(tf.reduce_mean((output - targets) ** 2), name=name)

def get_tensors(loss_fn):

    loss = loss_fn(y, targets, 'loss')
    grads = tf.gradients(loss, W, name='gradients')
    norm = tf.norm(grads, name='norm')

    return loss, grads, norm

targets = tf.random_uniform((6, 1))

with tf.name_scope('a'):
    loss_a, grads_a, norm_a = get_tensors(my_loss_fn)

with tf.name_scope('b'):
    loss_b, grads_b, norm_b = get_tensors(my_loss_fn)

with tf.name_scope('combined'):
    loss = tf.add(loss_a, loss_b, name='loss')
    grad = tf.gradients(loss, W, name='gradients')

with tf.Session() as sess:
    tf.global_variables_initializer().run(session=sess)

    writer = tf.summary.FileWriter('./tensorboard_results', sess.graph)
    res = sess.run([norm_a, norm_b, grad])

    print(*res, sep='\n')

Edit：针对您的评论...您可以使用tensorboard检查张量流模型的DAG https://www.tensorflow.org/get_started/graph_viz。我已经更新了存储图表的代码。

Run tensorboard --logdir $PWD/tensorboard_results在终端中并导航到命令行上打印的 url（通常是http://localhost:6006/）。然后单击“GRAPH”选项卡查看 DAG。您可以递归扩展张量、操作、命名空间以查看子图，从而查看各个操作及其输入。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

计算复合损失函数各部分的梯度范数的相关文章

在 python 上使用 TensorRT .engine 文件进行推理

我使用 Nvidia 的迁移学习工具包 TLT 进行训练然后使用 tlt converter 将 etlt 模型转换为 engine 文件我想使用这个 engine 文件在 python 中进行推理但由于我使用 TLT 进行训练因此
ImportError：无法从“tensorflow.python.keras.engine”导入名称“network”

尝试使用 anaconda 环境导入在 Tensorflow 2 3 0 上运行的 tf agents environments 时出现此错误尝试重新安装tensorflow 仍然出现同样的错误以管理员身份运行 jupyter 笔记本
如何用tensorflow计算AUC？

我已经使用 Tensorflow 构建了一个二元分类器现在我想使用 AUC 和准确性来评估分类器就准确性而言我可以轻松地这样做 X tf placeholder float None n input y tf placeholder
TensorFlow 数据集的函数 cache() 和 prefetch() 有何作用？

我正在关注 TensorFlow图像分割 https www tensorflow org tutorials images segmentation教程其中有以下几行 train dataset train cache shuffle
Tensorflow 何时更新权重和偏差？

张量流什么时候更新for循环中的权重和偏差下面是tf的github上的代码 mnist softmax py https github com tensorflow tensorflow blob master tensorflow ex
target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么？

根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
TensorFlow - 根据另一个变量的形状动态定义变量的形状

假设我有一定的张量x其维度未在图初始化时定义我可以使用以下方法获得它的形状 x shape tf shape input x 现在如果我想根据中定义的值创建一个变量x shape using y tf get variable vari
在 jupyter 中找不到 Tensorboard 作为魔法函数

我想使用最新的tensorflow 2 0 0a0在jupyter中运行tensorboard 使用tensorboard版本1 13 1和python 3 6 using tensorboard logdir logs base dir
在 Tensorflow 中混合前馈层和循环层？

有人能够在 Tensorflow 中混合前馈层和循环层吗例如输入 gt 转换 gt GRU gt 线性 gt 输出我可以想象一个人可以用前馈层定义自己的单元并且没有状态然后可以使用 MultiRNNCell 函数进行堆叠如下所示
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
Keras 模型中的 Softmax 采样

我考虑过的一些方法继承自 Model 类在tensorflow keras中采样softmax https stackoverflow com questions 52732145 sampled softmax in tensorflo
使用 TFLite 量化模型的参数进行计算操作

我正在尝试使用量化的 Mobilenetv2 模型在硬件中实现图像分类here https www tensorflow org lite guide hosted models 为此我首先需要从头到尾重现推理过程以确保我理解对数据执行
Google Colab：为什么 CPU 比 TPU 快？

我正在使用 Google colabTPU训练一个简单的Keras模型删除分布式strategy并在CPU比TPU 这怎么可能 import timeit import os import tensorflow as tf from sk
您必须为 MNIST 数据集的占位符张量“Placeholder”提供一个值，dtype float 和 shape [?,784]

这是我在 MNIST 数据集上测试量化的示例我正在使用以下代码测试我的模型 import tensorflow as tf from tensorflow examples tutorials mnist import input dat
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
Tensorflow lite 目标检测示例中相机的屏幕尺寸 [水平屏幕]

在tensorflow lite示例对象检测中相机不会拍摄整个屏幕而只会拍摄一部分我试图在 CameraActivity CameraConnectionFragment 和 Size 类中找到一些常量但没有结果所以我只是想要一种
运行 TensorFlow 时使用 CNMeM 有什么意义吗？

The CNMeM 库 https github com NVIDIA cnmem是一个帮助深度学习框架管理 CUDA 内存的简单库据报道 CNMeM 提供了一些有趣的速度改进 https datascience stackexchan
如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个

随机推荐

SSRS - 如何对 LookUpSet 表达式上的值求和

您好我有一列使用查找集表达式 Join LookupSet Fields ReportUNC Value Fields ReportUNC Value Format Fields cntSelfService Value 0 Execut
Java中如何判断一个数组是否包含某个特定值？

我有一个String 具有如下值 public static final String VALUES new String AB BC CD AE Given String s 有没有一个好的方法来测试是否VALUES包含s Arrays
VB6 类有析构函数吗？

当我执行诸如以下的语句时 Set MyObject Nothing 类中是否有一个被调用的特定函数即我可以用作析构函数来执行诸如清理数组与数据库断开连接等操作类似于Class Initialize 构造函数还有一个析构函数 Sub
PHP函数十六进制或RGB颜色到颜色名称

是否有一个 php 函数可以通过给出 rgb 或十六进制颜色作为参数来返回最接近的颜色名称我已经搜索了很多但找不到可以完成这项工作的函数请帮忙请参阅下面我的代码我用它来复制徽标颜色以在运行时自动更改网站主题希望它有效只需将图像
SortedList 与 SortedDictionary 与 Sort()

这是类似问题的延续this one https stackoverflow com questions 935621 whats the difference between sortedlist and sorteddictionary
如何在react-chartjs-2中设置选项？

反应图表 2https github com gor181 react chartjs 2 https github com gor181 react chartjs 2 正在引用下面图表JShttp www chartjs org do
.plist 中的 Xcode4ExternalHosts

我是 Xcode 和 Mac 环境的新手我正在尝试设置 PhoneGap Cordova 应用程序并且我得到了 ERROR whitelist rejection 我进行了彻底的 Google 搜索一切都表明我需要编辑我的 plist
如何绑定到 angular2 中的 data-* 属性？ [复制]

这个问题在这里已经有答案了假设我有非常大的单元格网格我想添加数据行和数据列属性值并从模型绑定如何绑定来自 Angular2 Dart 中的 beta0 的数据行与 data row boundVal 的绑定似乎不起作用输出 htm
flutter pub run build_runner build 出错

当我运行 flutter pub run build runner build 时我遇到了这个问题我尝试过 flutter clean flutter pub cache Repair flutter pub get 等解决方案在 p
Pandas Dataframe：将列拆分为多列，右对齐不一致的单元格条目

我有一个 pandas 数据框其中有一列名为城市州国家我想将此列分成三个新列城市州和国家 0 HUN 1 ESP 2 GBR 3 ESP 4 FRA 5 ID USA 6 GA USA 7 Hoboken NJ USA 8
如何在 Android 中修复在偏移量 YYY 处解组未知类型代码 XXX？

由于解组异常我在恢复时遇到应用程序崩溃我已经检查了所有可序列化对象都具有不带参数的构造函数甚至使用 ObjectStream 检查了所有可序列化对象保存到文件并从文件加载我如何理解导致异常的可分割偏移量的实际类类型 Parcel
IDX10603：算法：“HS256”要求 SecurityKey.KeySize 大于“128”位。报告的密钥大小：“32”。参数名称：key.KeySize

我刚刚使用 Asp Net Core Web API 并实现身份验证我从 Angular 应用程序调用这个 API 但我总是收到如下错误 IDX10603 算法 HS256 要求 SecurityKey KeySize 大于 128 位
将基于记录的列表/对象展平为数据帧

编辑这个问题已经过时了这jsonlite https cran r project org web packages jsonlite index html包装自动压平我正在处理具有基于记录的编码通常采用 JSON 的在线数据流对
Android NDK：从 JNI C 类调用 java 方法

我有 JNI 方法我试图在其中调用 Java 方法这是我的 JNI 代码 void DummySink afterGettingFrame unsigned frameSize unsigned numTruncatedBytes st
数据框中数据的遍历和操作

这是对前一个问题的参考是对该问题的扩展我想使用 Pandas 迭代 xlsx 包含时间戳并获取停机时间 https stackoverflow com questions 60808781 i want to iterate throu
重写线程池中线程的中断方法

假设我有这个 class Queue private static ExecutorService executor Executors newFixedThreadPool 1 public void use Runnable r Que
无法连接到 WSL2 内 docker 内的 mongo

我的设置有什么问题吗这是我的docker compose yml我从sudo docker compose up d 最终结果是这样的 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAM
RequireJS 在加载/解析依赖项之前调用回调

我遇到了 RequireJS 问题其中我的 main js 脚本引用了一个依赖项当运行 main js 中请求此依赖项的回调时该依赖项已加载但未解析我的目录结构是 index htm scripts require js main
测试链接服务器的连接并返回连接的链接服务器

我想编写一个脚本来测试所有链接的服务器并返回唯一连接的服务器肯定只有一个这是我当前的脚本但我陷入了困境 DECLARE retval INT DECLARE connected INT DECLARE name NVARCHAR 10
计算复合损失函数各部分的梯度范数

假设我有以下损失函数 loss a tf reduce mean my loss fn model output targets loss b tf reduce mean my other loss fn model output tar

计算复合损失函数各部分的梯度范数

计算复合损失函数各部分的梯度范数 的相关文章

随机推荐

热门标签

计算复合损失函数各部分的梯度范数的相关文章