.numpy()、.item()、.cpu()、.clone()、.detach()及.data的使用 && tensor类型的转换

2023-11-12

文章目录

.numpy()、.item()、.cpu()、.clone()、.detach()及.data的使用

本文主要介绍 .numpy()、.item()、.cpu()、.clone()、.detach()及.data这些常用的类型转换的函数或者方法的区分，以及在实际训练中遇到的实际问题。

.item()

item() 将一个Tensor变量转换为python标量（int float等单个的数值，但是不能是数组）常用于用于深度学习训练时，将loss值转换为标量并加，以及进行分类任务，计算准确值值时需要（如例一）。 item()是可以直接从gpu上转换为标量，看下面例一的loss.item() && 例二运行结果。

# 例一  在gpu上运行 计算loss值和acc值
optimizer.zero_grad()
outputs = model(data)
loss = F.cross_entropy(outputs, label)
acc = (outputs.argmax(dim=1) == label).sum().cpu().item() / len(labels)     #这里也用到了.item()，可以先转换到cpu
loss.backward()
optimizer.step()
train_loss += loss.item()   #这里用到了.item()，也可以直接item()
train_acc += acc
# 例二
a = torch.tensor([5],requires_grad=True,dtype=torch.float64,device='cuda')
print(a)
b = a.item()
print(b)
#输出： 
# tensor([5.], device='cuda:0', dtype=torch.float64, requires_grad=True)  
# 5.0

.cpu()

.cpu() 将数据的处理设备从其他设备（如.cuda()拿到cpu上），不会改变变量类型，转换后仍然是Tensor变量。 为什么需要这一步？因为gpu上的数组不能直接进行转换类型的操作。

a = torch.tensor([[1,2,3],[4,5,6]],requires_grad=True,dtype=torch.float64).cuda()
# 正确做法
b = a.cpu().detach().numpy()
b    
输出： array([[1., 2., 3.],
             [4., 5., 6.]])

.numpy()

numpy() Tensor.numpy()将Tensor转化为ndarray，这里的Tensor可以是标量（即item()的作用）或者向量（与item()不同，一般是矩阵），转换前后的dtype不会改变，但是要注意能直接numpy()的tensor的前提是没有梯度·（requires_grad=False）的。若有梯度（比如requires_grad=True，或者在神经网络的前向传播过程中），则需要先.detach()再进行numpy()。在后面还会讲解.detach()作用。

eg：

a = torch.tensor([[1.,2.]])
a_numpy = a.numpy() #[[1., 2.]]
a = torch.tensor(1.5)
a_numpy = a.numpy() #1.5

.clone()

.clone()函数可以返回一个完全相同的tensor,新的tensor开辟新的内存，但是仍然留在计算图中。**所以它复制完会保留原来的梯度，原来有梯度那么clone完也是有梯度的。**而没有梯度又可以直接用.numpy()转换为数组，用.clone()也不行，这个暂时感觉用的很少。

下列是有梯度不能用numpy() 的一个错误案例。在前向传播过程中.clone()依旧有梯度，所以不可numpy()

.detach()

.detach（） 函数可以返回一个完全相同的tensor,新的tensor开辟与旧的tensor共享内存，新的tensor会脱离计算图，不会牵扯梯度计算。也就是requires_grad=False, 因此可以 接着进行numpy() 的操作，解决了numpy()需要建立在无梯度的tensor的基础上的问题。

举例：前向传播过程中，如果在传播过程中用.detach()生成了新的变量，然后用这个新的变量继续往下传播，这样会导致梯度反向传播到这里就不能继续，前面的参数也不会发生改变了。

# enc_outputs ： 前向传播产生的变量
# enc_outputs1 ： 过程中自己生成的变量
for i in enc_outputs:
    a = i[0].cpu().detach().numpy()
    enc_outputs1.append(a)
return torch.tensor(enc_outputs1).to(device), enc_self_attns
# 进行训练的时候enc_outputs1脱离了计算，不进行反向传播了

.detach()就是返回一个新的tensor，并且这个tensor是从当前的计算图中分离出来的。但是返回的tensor和原来的tensor是共享内存空间的。当model不希望更新某部分的参数的时候，就可以用.detach()一下，如下例子:

如果A网络的输出被喂给B网络作为输入，如果我们希望在梯度反传的时候只更新B中参数的值，而不更新A中的参数值，这时候就可以使用.detach()

a = A(input)
a = a.deatch() # 或者a.detach_()进行in_place操作
out = B(a)
loss = criterion(out, labels)
loss.backward()

.data

.data — tensor .data 返回和 x 的相同数据 tensor,而且这个新的tensor和原来的tensor是共用数据的，一者改变，另一者也会跟着改变，而且新分离得到的tensor的require s_grad = False, 即不可求导的。（这一点其实detach是一样的）

a = torch.tensor([1.0], requires_grad=True)
b = a.data
print(b, b.requires_grad)
## 输出为： tensor([1.]) False

.data和.detach()不同点

.data 是一个属性，二.detach()是一个方法；

.data 是不安全的此篇文章解析.data为何是不安全的，.detach()是安全的。

参考博客

pytorch中.numpy()、.item()、.cpu()、.detach()及.data的使用

ValueError:only one element tensors can be converted to Python scalars解决办法

torch.Tensor

Tensor类型的转换：

torch.Tensor

CPU和GPU的Tensor之间转换 : 多用于将数据从gpu()转到cpu()，因为gpu上的数据不能直接操作
- data.cuda()：cpu –> gpu
- data.cpu()：gpu –> cpu

Tensor与Numpy Array之间的转换

data.numpy()：Tensor –> Numpy.ndarray

但是要注意此时需要转换的data是否有梯度
data有梯度时候,如果直接numpy(),会报错,正确做法是先.detach()

a = torch.tensor([[1,2,3],[4,5,6]],requires_grad=True,dtype=torch.float64)
b = a.numpy()
print(b)
# RuntimeError: Can't call numpy() on Tensor that requires grad. Use tensor.detach().numpy() instead.

# 正确做法
b = a.detach().numpy()
b    
输出： array([[1., 2., 3.],
             [4., 5., 6.]])

data没有梯度的时候，可以直接numpy()

a = torch.tensor([[1,2,3],[4,5,6]],dtype=torch.float64)
b = a.numpy()
print(b)
# array([[1., 2., 3.],[4., 5., 6.]])

若data在gpu上，需要先将数据移动到cpu上，具体操作如下：

a = torch.tensor([[1,2,3],[4,5,6]],requires_grad=True,dtype=torch.float64).cuda()
# 正确做法
b = a.cpu().detach().numpy()
b    
输出： array([[1., 2., 3.],
             [4., 5., 6.]])

torch.from_numpy(data)：Numpy.ndarray –> Tensor
- Numpy桥，将numpy.ndarray 转换为pytorch的 Tensor。返回的张量tensor和numpy的ndarray共享同一内存空间。修改一个会导致另外一个也被修改。返回的张量不能改变大小。
```
a = np.array([1, 2, 3])
t = torch.from_numpy(a)
t
# torch.LongTensor([1, 2, 3])
t[0] = -1
a
# array([-1,  2,  3]
```

Tensor的基本类型转换
- tensor.long()：
- tensor.half()：将tensor投射为半精度浮点(16位浮点)类型
- tensor.int()：
- tensor.double()：
- tensor.float()：
- tensor.char()：
- tensor.byte()：
- tensor.short()：
Tensor的基本数据类型转换
- type(dtype=None, non_blocking=False, **kwargs)：指定类型改变。例如data = data.type(torch.float32)
- type_as(tensor)：按照给定的tensor的类型转换类型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AI 训练bug调试and注意事项

python基础

NumPy

Pytorch

深度学习

.numpy()、.item()、.cpu()、.clone()、.detach()及.data的使用 && tensor类型的转换的相关文章

Python中的元素排列

数组 data 的每个元素都必须更改如下例如 4 应该可以在names A 和data A 中看到 4 的名字 A 是 David 现在 David 应该出现在names B 和data B 中 David 的 data B 是 30 所
对每个元素使用条件的 Numpy 过滤器

我有一个过滤器表达式如下 feasible agents filter lambda agent agent gt cost task agent agents where agents是一个Python列表现在为了提高速度我尝试使用
C++ 相当于 std::vector 上的 numpy.unique，具有 return_index 和 return_inverse

numpy有一个实施unique返回的算法 the 排序的唯一元素一个 numpy 数组 i e 没有重复项此外 numpy unique https numpy org doc stable reference generated nu
如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何获得凸包中均匀分布的点？

给定一组点 points np random randn n 3d points 我想均匀地填充由凸包定义的体积其中它们位于一个列表 np array of shapenx3 的 3d 点我可以得到凸包 hull scipy spati
获取 numpy 数组的多个轴的平均值

在 numpy 中是否有一种快速计算多轴平均值的方法我正在计算 n 维数组除 0 轴之外的所有轴的平均值我目前正在做这个 for i in range d ndim 1 d d mean axis 1 我想知道是否有一个不使用 pyth
Pandas：数据帧累积和，如果其他列为假则重置[重复]

这个问题在这里已经有答案了我有一个包含 2 列的数据框这里的目标很简单如果行列设置为 False 则重置 df cumsum df value condition 0 1 1 1 2 1 2 3 1 3 4 0 4 5 1 想要的结果
在python中将二维数组转换为彩色图像

我有这样的二维整数列表 list1 1 30 50 21 45 9 97 321 100 接下来我将把它转换为 numpy 数组 myarr np asarray list1 接下来我将使用 PIL 将其转换为图像如下所示 img Ima
查找矩阵内的匹配子矩阵

我有一个 100x200 2D 数组表示为由黑色 0 和白色 255 单元组成的 numpy 数组它是一个位图文件然后我有 2D 形状最容易将它们视为字母它们也是 2D 黑白单元格我知道我可以天真地迭代矩阵但这将是我的代码的
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
为什么 pandas 在简单的数学运算上比 numpy 更快？

最近我观察到 pandas 的乘法速度更快我在下面的例子中向您展示了这一点如此简单的操作怎么可能做到这一点这怎么可能呢 pandas 数据帧中的底层数据容器是 numpy 数组测量我使用形状为 10k 10k 的数组数据框 i
如何将 numpy rearray 的子集转换为连续数组？

我有一个recarray来自读取 csv 文件我有兴趣将列的子集转换为连续浮点数组我想避免将它们转换为列表或将它们一一堆叠我尝试了中的建议https stackoverflow com a 11792956 https stackov
如何调试 numpy 掩码

这个问题与this one https stackoverflow com q 73672739 11004423 我有一个正在尝试矢量化的函数这是原来的函数 def aspect good angle float planet1 goo
使用 Matplotlib 绘制二维数组

所以我有一个二维数组名为 Data 如下所示 Shape 0 Shape 1 Shape N Scale 0 Value00 Value01 Value0N Scale 1 Value10 Value11 Value1N Scale N
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
Python 和 Numpy 是 nan 和 set

我在使用 Python 的 Numpy set 和 NaN 非数字时遇到了不可预测的行为 gt gt gt set np float64 nan np float64 nan set nan nan gt gt gt set np flo
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
无法在 PyCharm 版本 9.3.3 中安装 NumPy。 Python版本3.8.2

在 PyCharm 中安装 NumPy 时出错尝试安装 Microsoft Visual C 14 0 还是行不通 NumPy 正在通过命令安装pip3 install numpy在 cmd 终端中但是当尝试将其安装在 PyCharm

随机推荐

作用域和堆内存的区别

作用域是函数执行的时候产生fn 函数执行的时候首先会开辟一个新的内存空间叫栈内存环境或作用域数据类型在赋值的时候会开辟一个新的内存空间叫堆内存存放代码块的二者都会形成一个内存地址生成对象的单例模式优势每个对象都是独立的即便属
@SuppressWarnings("resource")作用

1 实例 SuppressWarnings resource public static void main String args Scanner input new Scanner System in 写代码时 input 警告加上这个
若隐若现的芯片

先看效果再看代码
【java语法基础】常量与变量、数据类型,以及数据类型的转换

常量就是值永远不被改变的量声明一个常量需要用final关键字修饰具体格式 final 常量类型常量标识符常量值例如 final int PIE 18 注在定义一个常量标识符时所有的字符都要大写如果常量标识符由多个单词组成
用python实现数字图片识别神经网络--实现网络训练功能

上节我们完成了神经网络基本框架的搭建当时剩下了最重要的一个接口train 也就是通过读取数据自我学习进而改进网络识别效率的功能尚未实现从本节开始我们着手实现该功能自我训练过程分两步走第一步是计算输入训练数据给出网络的计算结果
git查看日志

目录引言 git查看该项目提交记录查看指定条数的记录显示提交的差异提交的简略信息按行显示提交信息按照指定格式显示记录指定文件的提交记录指定字符串或函数的提交记录示例引言有时需要对之前所做的一些修改查看记录这里是查看g
STM32F407ZGT6控制舵机（采用高级定时器8）

前言 32单片机给舵机供电不足会出现不稳定的情况舵机鬼畜所以要外加电源给舵机供电利用12v锂电池通过稳压模块降压到5 5v 提供给舵机稳压电路的gnd一定要接上32单片机的gnd 不共地虽然能供电但数据线无法传输数据 stm32
以太坊ERC-20协议详解

区块链学习 https github com xianfeng92 Love Ethereum ERC20是以太坊定义的一个代币标准 https github com ethereum EIPs blob master EIPS eip
计算机网络综合选择题

计算机网络综合选择题 TCP IP体系结构中的TCP和IP所提供的服务分别为 A 运输层服务和网络层服务 B 运输层服务和应用层服务 C 链路层服务和网络层服务 D 网络层服务和运输层服务答案 A 2 对于无序接收的滑动窗口协议若序号位
JAVA中的异常处理机制

JAVA中的异常处理机制 java异常处理中的关键字 try catch finally throw throws return try 检测代码块在此代码块中一旦检测到异常就会自动跳转到相应的catch try 检测代码块 catch
21_pre_access 阶段

文章目录限制每个客户端的并发连接数 limit conn 指令示例配置限制每个客户端的每秒处理请求数 limit req 指令限制每个客户端的并发连接数 ngx http limit conn module 生效阶段 ngx htt
Java实现FTP的上传和下载！

java实现连接FTP服务器实现文件的上传和下载一 FTP服务器 FTP服务器 File Transfer Protocol Server 是在互联网上提供文件存储和访问服务的计算机它们依照FTP协议提供服务 FTP协议是一种专门用来
一文简单了解RPMB

不知道大家对于RPMB有所了解吗最近在看这些存储介质的介绍的时候在推荐里面看到了这个东西又因为对安全本身就有所涉及学习所以这里来看看这个东西学习的内容都是来自前辈们的blog 会在文末附注 1 Flash是什么关于存储的种类有很
解决mysql忘记密码无法登陆问题

当我们忘记mysql密码的时候我们不仅无法访问数据库也无法修改密码这是个很头疼的问题下面是跳过用户验证登陆数据库的小技巧第一步打开我们安装mysql的目录复制 D PhpStudy PHPTutorial MySQL bin 地
同一端口有2个前端应用应该如何配置nginx.conf

需求业务系统中有2种完全不同角色页面没有相同模块拆分成了2个应用A和B 但后端是同一个后端部署的时候要求A和B在同一端口下问如何配置nginx 首先我们将A B前端包放到 opt app jhscf deploy html下这样
电脑如何打开虚拟化设置？

当你开启Vmware中的虚拟机时如果出现以上提示说明你的虚拟化没有打开在计算机中虚拟化英语 Virtualization 是一种资源管理技术是将计算机的各种实体资源如服务器网络内存及存储等予以抽象转换后呈现出来打破实
R语言-随机前沿分析法--SFA

3 1介绍生产函数模型 lnqi x i b vi ui 随机生产前沿函数 qi 产出变量向量 x i 投入变量向量 b 变量参数估计 vi 统计噪声的对称随机误差 ui 无效效应 3 2度量技术效率的方法 SFA 参数 DEA 非参数
Fortran 90学习之旅(一)Visual Fortran 6.5 的安装与第一个例子

转载请标明是引用于 http blog csdn net chenyujing1234 源码 http www rayfile com zh cn files e5f02f0a 8799 11e1 b6a2 0015c55db73d 高尔夫
Java 中封装JDBC连接到JDBCUtils工具类的详解

博主前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住也分享一下给大家点击跳转到网站前言在JDBC操作中获取连接和释放资源是经常使用到的可以将其封装成到一个工具类JDBCUtils中 JDBCUtils中有两个方法
.numpy()、.item()、.cpu()、.clone()、.detach()及.data的使用 && tensor类型的转换

文章目录 numpy item cpu clone detach 及 data的使用 item cpu numpy clone detach data data和 detach 不同点 Tensor类型的转换 numpy item cpu