Tensorflow GradientTape 间歇性地出现“变量不存在梯度”

2024-01-13

在训练我的网络时，我偶尔会遇到警告：

W0722 11:47:35.101842 140641577297728 optimizer_v2.py:928] Gradients does not exist for variables ['model/conv1d_x/Variable:0'] when minimizing the loss.

这种情况偶尔会偶尔发生（可能每 20 个成功步骤中就会发生一次）。我的模型基本上有两条路径，它们通过网络中不同位置的串联连接在一起。为了说明这一点，这里有一个简单的例子来说明我的意思。

class myModel(tf.keras.Model):

  def __init__(self):

    self.conv1 = Conv2D(32)
    self.conv2 = Conv2D(32)
    self.conv3 = Conv2D(16)

  def call(self, inputs):

    net1 = self.conv1(inputs)
    net2 = self.conv2(inputs)
    net = tf.concat([net1, net2], axis=2)
    net = self.conv3(net)
    end_points = tf.nn.softmax(net)

model = myModel()

with tf.GradientTape() as tape:

  predicition = model(image)
  loss = myloss(labels, prediction)

gradients = tape.gradient(loss, model.trainable_variables)
optimizer.apply_gradients(zip(gradients, model.trainable_variables))

实际上，我的网络要大得多，但通常没有梯度的变量往往是网络顶部的变量。在每个之前Conv2D我也有一个自定义渐变层。有时，当出现错误时，我可以注意到该层的梯度函数尚未被调用。

我的问题是，梯度磁带在通过我的网络向后传播时，有时会采取看似不同的路径。我的第二个问题是，这是由于我的网络有两条单独的路由（即 conv1 和 conv2）引起的。这个网络架构是否存在根本缺陷？

理想情况下，我可以定义为GradientTape()它必须找到每个顶层的梯度？

Nguyễn 和 gkennos 给出的解决方案将抑制错误，因为它将替换所有None由零。然而，一个大问题是你的梯度在任何时间点都为空。上述问题肯定是由unconnected variables（默认情况下 PyTorch 会抛出运行时错误）。

最常见的不连接层的情况可以举例如下：

 def some_func(x):
       x1 = x * some variables
       x2 = x1 + some variables #x2 discontinued after here
       x3 = x1 / some variables
       return x3

现在观察一下x2未连接，因此梯度不会被传播。仔细调试代码中未连接的变量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

Tensorflow GradientTape 间歇性地出现“变量不存在梯度” 的相关文章

在 Pandas 中，如何从基于另一个数据框的数据框中删除行？

我有 2 个数据框一个名为 USERS 另一个名为 EXCLUDE 他们都有一个名为电子邮件的字段基本上我想删除 USERS 中包含 EXCLUDE 中包含电子邮件的每一行我该怎么做您可以使用boolean indexing
如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

明白ES6中数组的区别了吗？

所以我有两个数组 const allLanguages ES EN DE const usedLanguages id 1 lang EN 生成新数组的最快方法是什么这两者之间有什么区别在老式的 JavaScript 中你必须在另一个
Android 中的图像视图上的文本叠加

我正在尝试将文本视图覆盖在图像视图上像这样的东西有人可以帮我解决代码吗将TextView和ImageView包裹到FrameLayout中将TextView放在FrameLayout中ImageView之后然后将 FrameLa
debounce 不适用于 Angular 中的 keyup 事件

我有一个text box输入一些文本来搜索记录我在用data ng model options debounce 1000 with keyup event data ng model options 工作正常但我想解雇keyup事件之
删除特定列中第一次出现 NaN 后的所有行（pandas）

我正在尝试使用 pandas 中的 dropna 函数我想将它用于特定的列如果所有行都有所有 NaN 值我只能弄清楚如何使用它来删除 NaN 我有一个数据框见下文我想在第一次出现 NaN 后删除所有行specific列 A 列当
AWK：使用正则表达式缩短 if-then-else

AWK 格式如下 REGEX Action 将执行Action如果当前行匹配REGEX 有没有办法添加一个else子句如果当前行与正则表达式不匹配则将执行该子句而不显式使用 if then else 如下所示 REGEX Action
C 是否对浮点常量进行舍入

关于Go中浮点精度的一个问题 https stackoverflow com questions 22337418 golang floating point precision float32 vs float64让我想知道C是如何处理这
如何在VB.Net面板中获取滚动条？

我正在 VB Net 中开发 Windows 应用程序在这种情况下有一种情况有一个表单在该表单中有一个面板面板内有一个富文本框所以我的要求是在面板中获得一个滚动条因此当用户在面板上滚动时富文本框可以像 MS Office
JSONP 调用显示“未捕获的语法错误：意外的标记：”

这是我的代码 ajax url https api flightstats com flex schedules rest v1 json flight AA 100 departing 2013 10 4 appId 19d57e69 a
如何使用 SoapClient 类进行 PHP SOAP 调用

我习惯于编写 PHP 代码但不经常使用面向对象的编码我现在需要与 SOAP 交互作为客户端但无法获得正确的语法我有一个 WSDL 文件它允许我使用 SoapClient 类正确设置新连接但是我无法真正做出正确的调用并获取返回
NSNumberFormatter 前导 0 和小数

有什么方法可以格式化带有前导 0 和小数的 NSNumber 吗例如我需要能够写 4 5 和 000 目前我拥有它它允许小数但不允许前导 0 NSNumberFormatter f NSNumberFormatter alloc i
用C#改变单元格的背景

我正在开发一个使用 C 来操作 Excel 文档的程序并且我正在使用 Microsoft Office Interop Excel Worksheet worksheet 当我将某些内容插入 x y 单元格时我使用 worksheet
在 free() 后将指针设置为 NULL 总是一个好习惯吗？ [复制]

这个问题在这里已经有答案了可能的重复释放后将变量设置为 NULL https stackoverflow com questions 1025589 setting variable to null after free 我正在学习良好
java.exe 的服务器选项

服务器热点和客户端热点有什么区别有什么理由将生产环境切换到 server 请分享您的实践经验有性能提升吗与 Oracle UCM 10g 相关是的可以有一个huge在某些情况下性能提升在对我的 Protocol Buffers
在java中设置代理

我创建了一项通过互联网发布内容的服务一切都很好但是当我将其部署到我们的服务器时我得到连接状态 403 禁止我认为这是因为我们的服务器不允许在未先登录的情况下直接访问互联网我们必须首先使用我们的用户名密码在浏览器中登录才能访问互联
通过地址栏加载远程 JavaScript 文件

是否可以从地址栏加载远程 JavaScript 文件我一直试图将其放入地址栏 javascript src http depot com file js funcname 我不会用它来做坏事我只是测试我的网站仅此而已如果你想保护你的
如何将 javaw.exe 控制台输出重定向到日志文件？

我想从批处理文件启动我的 Java 程序这是我想用来启动应用程序的脚本但问题是我无法将控制台输出重定向到日志文件任何人都可以提供任何提示而无需编辑任何代码并使用 Java 命令行选项或其他东西吗 echo off set TASK
如何在不换行的情况下打印完整的 NumPy 数组（在 Jupyter Notebook 中）

这个问题与这个问题不同如何打印完整的 NumPy 数组而不截断 https stackoverflow com questions 1987694 how to print the full numpy array without tru
Android Studio 在 M1 Apple Silicon 芯片上非常滞后

我已从第 7 代升级到 M1 芯片 2020 Macbook Air 英特尔芯片电脑总的来说我对此感到非常高兴和满意但当谈到我经常使用的 Android Studio 性能时我很抱歉地说非常令人失望 Apple Silicon 兼
如何在 Android 上的 ListActivity 中实现上下文菜单？

如何实现通过长按或点击使用内置布局和 ListAdapter 的 ListActivity 触发的上下文菜单在 onCreate 方法调用上注册上下文菜单 http developer android com reference andr
Tensorflow GradientTape 间歇性地出现“变量不存在梯度”

在训练我的网络时我偶尔会遇到警告 W0722 11 47 35 101842 140641577297728 optimizer v2 py 928 Gradients does not exist for variables model

Tensorflow GradientTape 间歇性地出现“变量不存在梯度”

Tensorflow GradientTape 间歇性地出现“变量不存在梯度” 的相关文章

随机推荐

热门标签