Tensorflow 无法获取变量的梯度，但可以获取张量的梯度

2024-04-13

我感兴趣的是计算损失的梯度，该梯度是根据 TensorFlow 中矩阵乘法与 Eager Execution 的乘积计算得出的。如果乘积被计算为张量，我可以这样做，但如果它是assign()ed 到变量中。这里是greatly减少代码：

import tensorflow as tf
import numpy as np
tf.enable_eager_execution()

multipliers_net = tf.get_variable("multipliers", shape=(1, 3, 3, 1),
                                  initializer=tf.random_normal_initializer())
activations_net = tf.Variable(tf.ones_like(multipliers_net))
output_indices = [(0, 1, 2, 0)]

def step():
    global activations_net

    #### PROBLEMATIC ####
    activations_net.assign(multipliers_net * activations_net)
    #### NO PROBLEM ####
    # activations_net = multipliers_net * activations_net

    return tf.gather_nd(activations_net, output_indices)


def train(targets):
    for y in targets:
        with tf.GradientTape() as tape:
            out = step()
            print("OUT", out)
            loss = tf.reduce_mean(tf.square(y - out))
            print("LOSS", loss)
        de_dm = tape.gradient(loss, multipliers_net)
        print("GRADIENT", de_dm, sep="\n")
        multipliers_net.assign(LEARNING_RATE * de_dm)


targets = [[2], [3], [4], [5]]

train(targets)

按照目前的情况，此代码将显示正确的 OUT 和 LOSS 值，但 GRADIENT 将打印为 None。但是，如果“PROBLEMATIC”下面的行被注释并且“NO PROBLEM”未被注释，则梯度计算得很好。我推断这是因为在第二种情况下，activations_net变成一个张量，但我不知道为什么这突然使梯度可计算，而之前却不能。

我很确定我应该保留activations_net and multiplier_net作为变量，因为在更大的方案中，两者都是动态更新的，据我了解，这些东西最好保留为变量，而不是不断地重新分配张量。

我将尽我所知尽力解释。问题出现在这一行

de_dm = tape.gradient(loss, multipliers_net)

If you print(tape.watched_variables()在“有问题”和“没有问题”的情况下，您会看到在第一种情况下磁带“手表”相同multipliers_net变量两次。你可以试试tape.reset() and tape.watch()，但只要你将 allocate op 传递给它，它就不会产生任何效果。如果你试试multipliers_net.assign(any_variable) inside tf.GradientTape()，你会发现它不起作用。但是如果你尝试分配一些产生张量的东西，例如tf.ones_like()，它会起作用的。

multipliers_net.assign(LEARNING_RATE * de_dm)

出于同样的原因，这也有效。看来只能接受eager_tensors希望这可以帮助

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 无法获取变量的梯度，但可以获取张量的梯度的相关文章

如何在python 3.7中生成条形码

我正在使用 python 3 7 为了生成条形码我尝试使用安装 pyBarcode 库pip install pyBarcode 但它显示以下错误找不到满足 pyBarcode 要求的版本来自版本找不到 pyBarcode 的匹配分
使用 pygame 显示 unicode 符号

我检查了其他答案但不明白为什么我的代码错误地显示 This is what I currently see https i stack imgur com 8tNIK png 这是关于文本渲染的相关代码 font pygame font
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
一段时间后终止线程的最 Pythonic 方法

我想在线程中运行一个进程它正在迭代一个大型数据库表当线程运行时我只想让程序等待如果该线程花费的时间超过 30 秒我想终止该线程并执行其他操作通过终止线程我的意思是我希望它停止活动并优雅地释放资源我认为最好的方法是通过Thre
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
在 Django 查询中使用 .extra(select={...}) 引入的值上使用 .aggregate() ？

我正在尝试计算玩家每周玩游戏的次数如下所示 player game objects extra select week WEEK games game date aggregate count Count week 但姜戈抱怨说 Fiel
Django 与谷歌图表

我试图让谷歌图表显示在我的页面上但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
TKinter 中的禁用/启用按钮

我正在尝试制作一个像开关一样的按钮所以如果我单击禁用按钮它将禁用按钮有效如果我再次按下它它将再次启用它我尝试了 if else 之类的东西但没有成功这是一个例子 from tkinter import fenster Tk
如何为不同操作系统/Python 版本编译 Python C/C++ 扩展？

我注意到一些成熟的Python库已经为大多数架构 Win32 Win amd64 MacOS 和Python版本提供了预编译版本针对不同环境交叉编译扩展的标准方法是什么葡萄酒虚拟机众包我们使用虚拟机和Hudson http hud

随机推荐

AssertionError：Egg-link ..与ReviewBoard的安装位置不匹配（位于/...）

AssertionError Egg link home daniel other rb reviewboard does not match installed location of ReviewBoard at home daniel
使用 cout << 运算符时，如何用前导零填充 int？ [复制]

这个问题在这里已经有答案了 I want cout输出一个带有前导零的 int 所以该值1将被打印为001和价值25打印为025 我怎样才能做到这一点通过以下内容 include
是否可以反映 Javascript 函数的参数？

是否有可能获取 Javascript 函数的所有参数被写入接受我知道所有 Javascript 函数参数都是可选的如果没有是否可以获得参数的数量例如在 PHP 中可以使用 class new ReflectionClass c
R Shinydashboard 动态菜单项

我正在尝试生成多个menuItem动态地可能很简单但我没有得到正确的想法 library shiny library shinydashboard port tables lt c tab1 tab2 tab3 tab4 These a
使用 async/await 与 Promise 的区别？

我正在寻找有关在我的 NodeJS 应用程序中使用什么的答案我有处理对 mssql 的通用 dB 访问的代码这段代码是使用async函数然后我使用承诺来调用该函数一切正常随着我的应用程序变得越来越大代码也越来越大我计划将一些逻
CreateWindowEx的lpClassName参数怎么可以是可选的

根据MSDN http msdn microsoft com en us library windows desktop ms632680 aspx the lpClassName的参数CreateWindowEx是可选的 lpClassN
.net 框架启动的版本与 .net 框架引导程序项目不匹配

当我构建刚开始使用的 vb net 2010 的发布项目时我收到两个警告 net Framework 启动条件的版本与所选的 net Framework 引导程序包不匹配更新 netframewk 启动条件以匹配先决条件对话框中选择的
使用perl从多表html文件中提取特定表[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我有一个包含三个表的 html 文件但我只想提取三张表中的一张我该怎么做呢您可以使用已知的Perl模块如 LWP WWW Mechan
能否在 C++11 中检索线程函数的返回值？

如果一个函数有一个非空返回值并且我使用 join那么函数有没有办法获取它的返回值呢这是一个简化的示例 float myfunc int k return exp k int main std thread th std thread my
从查找公式返回单元格引用而不使用匹配

我有一个电子表格记录一段时间内的每日销售数量我想计算平均每日销售额但排除我们开始销售产品之前的日子因为它们都返回 0 我有下面的查找函数它返回包含大于 0 的值的行中最后一个单元格的值 LOOKUP 2 1 F5 L5 gt 0
maven pom xml 文件中的错误：构建 Android 项目 [重复]

这个问题在这里已经有答案了我在 pom xml 文件中的插件标签中收到错误错误出现在插件标签上 groupId 之前 Error Plugin execution not covered by lifecycle configurati
android：如何禁用开关动画？

最近我正在使用名为 switch 的小部件开关是 Android Studio 的默认小部件问题是当我使用开关添加新项目时它的动画将会运行但我不想看到它我在项目中使用了ListView和Cursor Adapter 开关是一个
使用 BUTTON 标签关闭表单提交上的 Fancybox iframe - 不起作用

根据 Fancybox API 我在 iframe 中使用以下代码
使用 java 反编译器 jd-gui 并获取 // 内部错误 //

我使用 dex2jar 反编译了一个 apk 文件并在 jd gui 中打开了生成的 jar 文件我可以很好地查看几乎所有代码但其中一个部分常量仅显示 INTERNAL ERROR 没有别的有没有办法检索常量任何经过这个问题的
如何从字符串设置 imageView 的图像？

我在 res drawable mdpi 目录中有一个条目列表和一些位图文件我试图通过生成路径字符串并使用位图工厂来加载与从列表中选择的字符串值相对应的图像问题是我认为我的路径不正确因为位图始终为空即使对于默认图像也是如此 Stri
Windows 8（64 位）上 R 中 foreach 循环的内存问题（doParallel 包）

我正在尝试从串行方法转向并行方法以在大型数据集上完成一些多元时间序列分析任务data table 该表包含许多不同组的数据我正在尝试从for循环到一个foreach循环使用doParallel软件包以利用安装的多核处理器我遇到的问题与
在 PixelCopy 中保存离屏视图的图像

我有一个屏幕ScrollView 然后当我点击滚动视图底部的按钮时我会保存视图的图像我遇到的问题是我无法将滚动视图的上部屏幕外保存为图像我在用PixelCopy使用以下代码 fun takeScreenshot view Vie
CSS 中每个
标题下方的水平线/线

我试图在每个实例下方自动放置一条 100 水平线规则 h1 使用 CSS 的标头标签我想看到的示例剪断 8 介绍剪断 8 我的CSS中有这个 mypage headline font family Calibri Helvetica
AntiForgery.GetTokens：oldCookieToken 参数的用途是什么？

我们正在使用 Objective C 编写一个 iOS 移动应用程序用于向我们的 ASP NET MVC 服务器应用程序发送帖子在 iPhone 上 HTTP 堆栈和 cookie 等似乎与 Safari 共享这使我们容易受到 X
Tensorflow 无法获取变量的梯度，但可以获取张量的梯度

我感兴趣的是计算损失的梯度该梯度是根据 TensorFlow 中矩阵乘法与 Eager Execution 的乘积计算得出的如果乘积被计算为张量我可以这样做但如果它是assign ed 到变量中这里是greatly减少代码 imp

Tensorflow 无法获取变量的梯度，但可以获取张量的梯度

Tensorflow 无法获取变量的梯度，但可以获取张量的梯度 的相关文章

随机推荐

CSS 中每个 标题下方的水平线/线 我试图在每个实例下方自动放置一条 100 水平线 规则 h1 使用 CSS 的标头标签 我想看到的示例 剪断 8 介绍 剪断 8 我的CSS中有这个 mypage headline font family Calibri Helvetica

热门标签

Tensorflow 无法获取变量的梯度，但可以获取张量的梯度的相关文章

CSS 中每个
标题下方的水平线/线

我试图在每个实例下方自动放置一条 100 水平线规则 h1 使用 CSS 的标头标签我想看到的示例剪断 8 介绍剪断 8 我的CSS中有这个 mypage headline font family Calibri Helvetica