为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？

2024-01-06

已经确定的是my_tensor.detach().numpy()是从 a 获取 numpy 数组的正确方法torch tensor. https://stackoverflow.com/questions/55466298/pytorch-cant-call-numpy-on-variable-that-requires-grad-use-var-detach-num

我正在尝试更好地理解原因。

In the 接受的答案 https://stackoverflow.com/a/57014852/1048186对于刚刚链接的问题，Blupon 指出：

您需要将张量转换为除了实际值定义之外不需要梯度的另一个张量。

在他链接到的第一个讨论中，albanD 指出：

这是预期的行为，因为转移到 numpy 会破坏图形，因此不会计算梯度。

如果你实际上不需要梯度，那么你可以显式地 .detach() 需要 grad 的 Tensor 来获得与不需要 grad 内容相同的张量。然后可以将另一个张量转换为 numpy 数组。

在他链接到的第二个讨论中，apaszke 写道：

变量不能转换为 numpy，因为它们是保存操作历史记录的张量的包装器，而 numpy 没有这样的对象。您可以使用 .data 属性检索变量保存的张量。然后，这应该可以工作：var.data.numpy()。

我已经研究了 PyTorch 的自动微分库的内部工作原理，但我仍然对这些答案感到困惑。为什么它会破坏图表以转移到 numpy？是否因为 numpy 数组上的任何操作都不会在 autodiff 图中跟踪？

什么是变量？它与张量有何关系？

我觉得这里需要一个彻底的高质量 Stack-Overflow 答案，向尚不了解自动微分的 PyTorch 新用户解释其原因。

特别是，我认为通过图来说明该图并显示此示例中断开连接是如何发生的将很有帮助：

import torch

tensor1 = torch.tensor([1.0,2.0],requires_grad=True)

print(tensor1)
print(type(tensor1))

tensor1 = tensor1.numpy()

print(tensor1)
print(type(tensor1))

我认为理解这里最关键的一点是不同之处之间torch.tensor and np.ndarray:
虽然这两个对象都用于存储 n 维矩阵（又名“张量” https://en.wikipedia.org/wiki/Tensor), torch.tensors有一个额外的“层” - 它存储导致关联的 n 维矩阵的计算图。

因此，如果您只对在矩阵上执行数学运算的有效且简单的方法感兴趣np.ndarray or torch.tensor可以互换使用。

然而，torch.tensors 的设计目的是在以下情况下使用梯度下降 https://en.wikipedia.org/wiki/Gradient_descent优化，因此它们不仅包含具有数值的张量，还包含（更重要的是）导致这些值的计算图。然后使用该计算图（使用导数的链式法则 https://en.wikipedia.org/wiki/Chain_rule）来计算损失函数相对于用于计算损失的每个自变量的导数。

正如之前所提，np.ndarray对象没有这个额外的“计算图”层，因此，当转换torch.tensor to np.ndarray你必须明确地使用以下方法删除张量的计算图detach()命令。

计算图
从你的comments https://stackoverflow.com/questions/63582590/why-do-we-call-detach-before-calling-numpy-on-a-pytorch-tensor/63869655?noredirect=1#comment112956796_63869655好像这个概念有点模糊。我将尝试用一个简单的例子来说明它。
考虑两个（向量）变量的简单函数，x and w:

x = torch.rand(4, requires_grad=True)
w = torch.rand(4, requires_grad=True)

y = x @ w  # inner-product of x and w
z = y ** 2  # square the inner product

如果我们只对价值感兴趣z，我们不需要担心任何图表，我们只需移动forward从输入中，x and w，计算y进而z.

然而，如果我们不太关心它的价值，会发生什么？z，而是想问这个问题“什么是w that 最小化 z对于给定的x"?
为了回答这个问题，我们需要计算衍生物 of z w.r.t w.
我们怎样才能做到这一点？
使用链式法则 https://en.wikipedia.org/wiki/Chain_rule我们知道dz/dw = dz/dy * dy/dw。也就是说，计算梯度z w.r.t w我们需要搬家backward https://stackoverflow.com/a/57249287/1714410 from z回到w计算gradient我们追踪每一步的操作back https://stackoverflow.com/a/57249287/1714410我们的脚步从z to w。我们追溯的这条“路径”就是计算图 of z它告诉我们如何计算导数zw.r.t 导致的输入z:

z.backward()  # ask pytorch to trace back the computation of z

我们现在可以检查梯度z w.r.t w:

w.grad  # the resulting gradient of z w.r.t w
tensor([0.8010, 1.9746, 1.5904, 1.0408])

请注意，这完全等于

2*y*x
tensor([0.8010, 1.9746, 1.5904, 1.0408], grad_fn=<MulBackward0>)

since dz/dy = 2*y and dy/dw = x.

路径上的每个张量都存储其对计算的“贡献”：

z
tensor(1.4061, grad_fn=<PowBackward0>)

And

y
tensor(1.1858, grad_fn=<DotBackward>)

如你看到的，y and z不仅存储“远期”值<x, w> or y**2但也计算图 -- the grad_fn当追溯梯度时需要计算导数（使用链式法则）z（输出）到w（输入）。

These grad_fn是必不可少的组成部分torch.tensors没有它们，我们就无法计算复杂函数的导数。然而，np.ndarray他们根本没有这种能力，也没有这种信息。

请参见这个答案 https://stackoverflow.com/a/57249287/1714410有关使用追溯导数的更多信息backwrd()功能。

既然两者np.ndarray and torch.tensor有一个共同的“层”存储 n 维数字数组，pytorch 使用相同的存储来节省内存：

numpy() → numpy.ndarray https://pytorch.org/docs/stable/tensors.html#torch.Tensor.numpy
退货self张量作为 NumPy ndarray。这个张量和返回的ndarray共享相同的底层存储。 self 张量的更改将反映在 ndarray 中，反之亦然。

另一个方向也以同样的方式工作：

torch.from_numpy(ndarray) → Tensor https://pytorch.org/docs/stable/generated/torch.from_numpy.html#torch.from_numpy
从 numpy.ndarray 创建张量。
返回的张量和ndarray共享相同的记忆。对张量的修改将反映在 ndarray 中，反之亦然。

因此，当创建一个np.array from torch.tensor反之亦然，双方都反对参考内存中相同的底层存储。自从np.ndarray不存储/表示与数组关联的计算图，该图应该是明确地删除使用detach()当共享 numpy 和 torch 时希望引用相同的张量。

请注意，如果您出于某种原因希望仅使用 pytorch 进行数学运算而不进行反向传播，则可以使用with torch.no_grad() https://pytorch.org/docs/stable/generated/torch.no_grad.html#torch.no_grad上下文管理器，在这种情况下不会创建计算图torch.tensors and np.ndarrays 可以互换使用。

with torch.no_grad():
  x_t = torch.rand(3,4)
  y_np = np.ones((4, 2), dtype=np.float32)
  x_t @ torch.from_numpy(y_np)  # dot product in torch
  np.dot(x_t.numpy(), y_np)  # the same dot product in numpy

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？的相关文章

pandas 中的滚动减法

我正在尝试做类似的事情 ff pd DataFrame uid 1 1 1 20 20 20 4 4 4 date 09 06 10 06 11 06 09 06 10 06 11 06 09 06 10 06 11 06 balance
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
如何合并非常大的 numpy 数组？

我会有很多Numpy https docs scipy org doc numpy 1 14 0 reference arrays https docs scipy org doc numpy 1 14 0 reference arrays
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
对 FastAI 中的数据应用图像增强转换时出错

我正在尝试复制这个 Kaggle 笔记本https www kaggle com tanlikesmath diabetic retinopathy with resnet50 oversampling https www kaggle c
如何提高大规模数据帧上 lambda 函数的性能

我有一个df超过数亿行 latitude longitude time VAL 0 39 20000076293945312500 140 80000305175781250000 1972 01 19 13 00 00 1 2000000
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
并行 dask for 循环比常规循环慢？

如果我尝试使用 dask 并行化 for 循环它最终会比常规版本执行得慢基本上我只是按照 dask 教程中的介绍性示例进行操作但由于某种原因它在我这边失败了我究竟做错了什么 In 1 import numpy as np from
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n
如何在Python中计算正态分布的百分位数？

问题陈述随机变量 X 是 N 25 4 找到 X 的指定百分位 A 第 10 个百分位数 b 第 90 个百分位数 C 第 80 个百分位数 d 第 50 个百分位数尝试1 My code import numpy as np impo
如何使用 numpy 在二维数组上执行最大/平均池化

给定一个 2D M x N 矩阵和一个 2D 内核 K x L 我如何返回一个矩阵该矩阵是使用图像上给定内核进行最大或平均池化的结果如果可能的话我想使用 numpy 注意 M N K L 可以是偶数也可以是奇数并且它们不需要彼此完全整
Numpy 通过一个数组的值总结另一个数组

我正在尝试找到一种矢量化方法来完成以下任务假设我有一个 x 和 y 值的数组请注意 x 值并不总是整数并且可以为负数 import numpy as np x np array 1 1 1 3 2 2 2 5 4 4 dtype flo
TypeError: ufunc 'subtract' 不包含签名匹配类型的循环 dtype('

当尝试获取小玩具数据集的直方图时 numpy 通过 matplotlib 出现奇怪的错误我只是不确定如何解释该错误这使得很难知道下一步该做什么不过没找到太多相关的这个nltk问题 https stackoverflow com que

随机推荐

页面加载时的 jQuery .fadeIn() ？

我正在尝试设置一些代码以便我有一个首先隐藏但在页面加载后淡入的代码我有以下 HTML 代码 div class hidden p This is some text p div 然后我还有这个 CSS 代码它隐藏了 div div h
如何从war文件中获取java源代码？

我没有最新的源代码但在服务器上部署了 war 最新文件请建议最好的方法1 从war ear获取源代码2 将可用源代码与 war ear 中存在但可用源代码中缺失的代码进行比较并合并更新我正在使用 ECLIPSE IDE 提前致谢
如何在 Mac 上与图层支持的视图交互

我正在设计一个包含多个标签和文本字段的用户界面我想像这样设计用户界面为我的内容视图设置背景图案NSWindow 在左上角背景添加自定义图标我通过将内容视图设置为层支持视图如中所述Apple 的文档NSView http develop
使用 Scipy 进行图像腐蚀和膨胀

我正在尝试使用 scipy 来做erosion http docs scipy org doc scipy reference generated scipy ndimage morphology binary erosion html a
弥补 Java 中基于多态参数的运行时方法查找不足的模式？

看来Java无法根据参数的运行时类型选择最合适的方法实现如文档所示here http www rizzoweb com java polymorphismAndOverloading html 回顾一下这个例子 class Supercl
在安装 conda 包期间更新 @INC 变量

我正在尝试安装 Perl 模块的 conda 包到目前为止我可以使用创建包conda build 为此我有一个食谱其中包含build sh and a meta yaml files 然后我使用安装它conda install在新环
Angular 2 azure 部署刷新错误：您正在查找的资源已被删除、名称已更改或暂时不可用

我有一个 Angular 2 rc 2 应用程序实现了基本路由路径是 path1这是默认路径并且 path2 回家之路重定向到 path1 当我在本地 lite server 运行它时一切正常我设法将此应用程序部署到 Azure
如何在Python中将具有相似文本的数据框分组

我有一个像这样的数据框 DF DF pd DataFrame Code abc abc abc abc def Description ABC String ABC String ABC String and sth Only sth el
通过浏览器访问ePass2003 Auto令牌

我已经加载了带有自签名证书的 ePass2003 Auto 令牌我将 lib so 文件加载到 Firefox 中现在 Firefox 可以在令牌中列出证书我的要求是访问密钥库以进行签名加密和解密即用于对其进行加密操作的公钥和私钥
静态对象状态如何在 MSpec 上下文之间共享/设置？

在编写一些 MSpec BDD 测试时我遇到了一个场景其中我预计会失败的测试通过了但只有当我运行所有测试时才通过当我单独运行测试时它按预期失败了经过一番调查后我发现在第二个测试运行之前上一个测试中设置的某些状态没有被重置这
对象正在初始化为不需要的值

我一直在做一项琐碎的作业来习惯编码我正在设计一台 ATM 机目前它由 2 个类组成银行账户 cpp 不同类型账户的构造函数只有会员才有余额交易 cpp 在 BankAccount 上执行一个方法即存款取款和获取余额 Probl
Laravel Eloquent 比较日期时间字段中的日期

我想通过表达式获取表中的所有行 table date lt 2014 07 10 但如果该列包含日期时间我们可以说 2014 07 10 12 00 00 但如果我这样做 where date lt date 它不会得到该行我猜这是因为
为鼠标悬停时的 jquery 事件添加延迟

我正在尝试为孩子的鼠标悬停事件添加简单的延迟但遇到了困难仍在学习这使我能够在延迟后显示弹出窗口但同时显示所有弹出窗口 onmouseover setTimeout function skinnyPopup show 600 这可以立
phonegapresolveLocalFileSystemURL 不适用于 Android 上的内容 uri

我想使用 Android 版本 5 1 1 上的 Nexus 4 手机从 Android 图片库接收共享图像我正在使用phonegap 4 2和phonegap WebIntent插件github链接 https github com f
正则表达式匹配2个标签之间的所有内容

我正在尝试使用正则表达式捕获 PHP 中的以下内容名称测试描述我的测试我已经尝试过这里的代码使用正则表达式匹配两个标签之间的所有内容 https stackoverflow com questions 287991 match
如果没有 Linq 对象的数据上下文，如何保存它？

我有一个 Linq 对象我想对其进行更改并保存它如下所示 public void DoSomething MyClass obj obj MyProperty Changed MyDataContext dc new MyDataCon
有没有办法在 Selenium WebDriver 中使用 JavaScript 通过 XPath 获取元素？

我正在寻找类似的东西 getElementByXpath html 1 body 1 div 1 innerHTML 我需要使用 JS 获取元素的innerHTML 在 Selenium WebDriver Java 中使用它因为 Web
JsonConverter CanConvert 不接收类型

我有一个习惯JsonConverter 这似乎没有被正确调用我已经创建了转换器并将其添加到JsonSerializerSettings Converters集合并标记了我正在序列化的实体上的属性 JsonConverter typeof
修复 Terraform 中的“仅插值表达式已被弃用”警告

我升级到 Terraform v0 12 16 现在我收到很多类似这样的消息 Warning Interpolation only expressions are deprecated on modules test notifier te
为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？

已经确定的是my tensor detach numpy 是从 a 获取 numpy 数组的正确方法torch tensor https stackoverflow com questions 55466298 pytorch cant c

为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？

为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？ 的相关文章

随机推荐

热门标签

为什么我们在 Pytorch 张量上调用 .numpy() 之前先调用 .detach()？的相关文章