为什么 autograd 不产生中间变量的梯度？

2023-12-29

尝试了解渐变的表示方式以及 autograd 的工作原理：

import torch
from torch.autograd import Variable

x = Variable(torch.Tensor([2]), requires_grad=True)
y = x * x
z = y * y

z.backward()

print(x.grad)
#Variable containing:
#32
#[torch.FloatTensor of size 1]

print(y.grad)
#None

为什么它不产生梯度y? If y.grad = dz/dy，那么它不应该至少产生一个像这样的变量y.grad = 2*y?

默认情况下，仅保留叶变量的梯度。非叶变量的梯度不会保留以供以后检查。这是按设计完成，以节省内存。

-苏米特·金塔拉

See: https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94 https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94

选项1：

Call y.retain_grad()

x = Variable(torch.Tensor([2]), requires_grad=True)
y = x * x
z = y * y

y.retain_grad()

z.backward()

print(y.grad)
#Variable containing:
# 8
#[torch.FloatTensor of size 1]

Source: https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/16 https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/16

选项2：

注册一个hook，这基本上是计算梯度时调用的函数。然后你可以保存它、分配它、打印它，等等......

from __future__ import print_function
import torch
from torch.autograd import Variable

x = Variable(torch.Tensor([2]), requires_grad=True)
y = x * x
z = y * y

y.register_hook(print) ## this can be anything you need it to be

z.backward()

output:

Variable containing:  8 [torch.FloatTensor of size 1

Source: https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/2 https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/2

另请参阅：https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/7 https://discuss.pytorch.org/t/why-cant-i-see-grad-of-an-intermediate-variable/94/7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

Autograd

为什么 autograd 不产生中间变量的梯度？的相关文章

在pytorch中使用tensorboard，但得到空白页面？

我在pytorch 1 3 1中使用tensorboard 并且我在张量板的 pytorch 文档 https pytorch org docs stable tensorboard html 运行后tensorboard logdir r
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
Pytorch - 推断线性层 in_features

我正在构建一个玩具模型来获取一些图像并进行分类我的模型看起来像 conv2d gt pool gt conv2d gt linear gt linear 我的问题是当我们创建模型时我们必须计算第一个线性层的大小in features基
运行时错误：大小不匹配，m1：[4 x 3136]，m2：[64 x 5]位于c：\ a \ w \ 1 \ s \ tmp_conda_3.7_1

我使用 python 3 当我插入变换随机裁剪大小 224 时它会给出未匹配错误这是我的代码 https github com kajasumanie medical plant classification blob master i
softmax_cross_entropy_with_logits 的 PyTorch 等效项

我想知道 TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy with logits TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy

随机推荐

解析失败：Lcom/google/android/gms/common/api/Api$zzf；

当我们运行应用程序的 apk 文件时我收到此错误在build gradle我们设置multidex并编译multidex存在于Gradle文件中我们将 Firebase 版本更改为上方和下方但这对我们不起作用这是我们在运行控制台的
提取每第 n 个字母（数字）

我有一个包含行名称空格和零和一字符串的文件我需要提取零和一字符串的每第 5 个字符对结果求和如果总和不为 0 保存名称到另一个文件中 1rt2 0001000000100000000000001010000100000000010
框架“可扩展性良好”是什么意思？

当阅读有关框架 net ruby on Rails django spring 等时我不断地看到某些框架的扩展性很好或不好当有人说框架可扩展性良好时这是什么意思而说框架可扩展性不好又是什么意思谢谢当您根据并发用户绘制一
简单的 Javascript 数学函数 - 加法/不起作用？

这是我的功能 var ans X X Y Z 当我进入10 20 and 10 分别加法位的结果为2010并不是30 我怎样才能解决这个问题确保首先将字符串转换为数字 var X 10 var Y 20 var Z 10 X X una
如何在 SQL*Plus 中打开存储过程并对其进行编辑

我需要对一个过时的机器上的旧 Oracle 存储过程进行一些更改该机器保留下来运行旧的遗留进程我唯一可以连接到数据库的工具是 SQL加如何将存储过程加载到内存中以在 SQL 中进行编辑Plus 我在网上找到的教程没有解释这是如何完成的
git push 说一切都是最新的，而实际上它绝对不是

我有一个公共存储库没有其他人对其进行分叉拉取或其他任何操作我对一个文件做了一些小的更改成功提交它们并尝试推送它说一切都是最新的没有分支机构我对 git 非常非常陌生我不明白到底发生了什么 git remote show
如何在SQL Server中为自动增量列指定特定值？

我在 sql server 中有一个自动增量标识列但我想为其中一行指定特定值因此编号方案如下 1 2 999 for the reserved entry 3 n 我怎样才能做到这一点你需要使用IDENTITY INSERT SET
适用于 iOS 的 Elasticsearch 客户端

有人知道适用于 iOS 的 elasticsearch 客户端库吗如果它也用 swift 编写那就太好了弹性搜索客户端部分显示了多个平台的多个库但没有显示 iOS 的任何内容我觉得一定有人这样做了 Cheers 我怀疑没有人这
Rust：使用结构向量的极坐标中的数据帧

Problem 我想读入数据polars数据帧来自mysql数据库我在用sqlx sqlx生成结构向量例如 Vec
安装oracle 11g后sql plus打不开

我安装了 oracle 11g 我试图从命令提示符打开 sqlplus 但它在不到一秒的时间内打开和关闭我也尝试从安装位置打开 sqlplus 它仍然显示出相同的行为谁能帮我解决一下由于其他一些错误我已经卸载并安装了两次 oracl
Pyparsing 支持上下文相关语法吗？

如果我的术语不正确请原谅我也许只要用正确的词语来描述我想要的东西就足以让我自己找到答案我正在开发 ODL 对象描述语言的解析器据我所知这是一种神秘的语言现在仅由 NASA PDS 行星数据系统这是 NASA 向公众提供数
git Android Studio 使用的 ssh-key

我需要连接到一个组织因此需要提供公共 ssh 密钥但是我不确定 Android Studio 使用哪个 ssh 密钥我发现自己对 Android Studio 中的各种 ssh 选项感到困惑它是否只是使用我当前 git 安装生成的
Laravel 在关系对象上的位置

我正在使用 Laravel 5 0 开发一个 Web API 但我不确定我正在尝试构建的特定查询我的课程如下 class Event extends Model protected table events public timestam
zsh：在函数中设置opt并使其粘住

我正在尝试将分析添加到函数内部的 zshrc 中 via http stackoverflow com a 4351664 329700 profile startup PS4 usr local bin gdate s N N i gt
在 ASP.NET 5 中使用 WebClient

我正在使用 VS15 beta 并尝试使用 WebClient 虽然引用了 System Net 并且智能感知表明 WebClient 类可用但在构建时出现以下错误命名空间 System Net 中不存在类型或命名空间名称 WebCli
JavaScript - 从字符串变量获取数组对象

var list OVER 30 true NUM OF JACKETS gt 3 COUNT TOTAL 500 var array getList array 0 OVER 30 true array 0 NUM OF JACKETS
错误：无法为 pymssql 构建轮子，这是在 Mac M1 中安装基于 pyproject.toml 的项目所必需的

我使用的是带有 M1 芯片的 MacBook 但似乎有很多东西没有针对它进行优化 pyodbc不适合我所以我想使用pymssql 不过当我尝试运行时遇到了这个问题pip install pymssql 错误如下 Using cached
Swift Swiftui - 将颜色保存到 UserDefaults 并从 @AppStorage 使用它

在我的 MacOS 和 iOS 应用程序中我使用从此处创建的颜色 https uiwjs github io ui color https uiwjs github io ui color 然后是 f e 工作正常 Color red 1
无损 ffmpeg 转换/编码

我在转换视频时寻找最好的质量我只想使用无损音频和视频编码器以及一个好的容器如何为 ffmpeg 启用无损 x264 vcodec 我目前使用ffmpeg i inputvideo s 1280x720 ar 48000 threads
为什么 autograd 不产生中间变量的梯度？

尝试了解渐变的表示方式以及 autograd 的工作原理 import torch from torch autograd import Variable x Variable torch Tensor 2 requires grad Tr

热门标签