pytorch in-place 引用深拷贝的坑

2023-05-16

一、引用、拷贝

pytorch引用和深拷贝

（1）原来 Torch 中为了提高速度，model:forward() 操作之后赋予的变量是不给这个变量开盘新的存储空间的，而是引用。就相当于起了个别名。

不光这里，torch里面向量或是矩阵的赋值是指向同一内存的，这种策略不同于 Matlab。如果想不想引用，可以用 clone() 进行深拷贝

（2）getParameters()

This function will go over all the weights and gradWeights and make them view into a single tensor (one for weights and one for gradWeights). Since the storage of every weight and gradWeight is changed, this function should be called only once on a given network.

参考：https://blog.csdn.net/u010167269/article/details/52073136

python的赋值

在 python 中赋值语句总是建立对象的引用值，而不是复制对象。因此，python 变量更像是指针，而不是数据存储区域，

Python 没有「变量」，我们平时所说的变量其实只是「标签」，是引用

参考：https://draapho.github.io/2016/11/21/1618-python-variable/

深拷贝和浅拷贝

Python中的对象之间赋值时是按引用传递的，如果需要拷贝对象，需要使用标准库中的copy模块。

1、copy.copy 浅拷贝只拷贝父对象，不会拷贝对象的内部的子对象。

2、copy.deepcopy 深拷贝拷贝对象及其子对象

参考：https://blog.csdn.net/NockinOnHeavensDoor/article/details/80645490

二、in-place

in-place operation在pytorch中是指改变一个tensor的值的时候，不经过复制操作，而是直接在原来的内存上改变它的值。可以把它成为原地操作符。

在pytorch中经常加后缀“_”来代表原地in-place operation，比如说.add_() 或者.scatter()。python里面的+=，*=也是in-place operation。

在 pytorch 中, 有两种情况不能使用 inplace operation:

1. 对于 requires_grad=True 的叶子张量(leaf tensor) 不能使用 inplace operation

2. 对于在求梯度阶段需要用到的张量不能使用 inplace operation

ps:如果你使用了in-place operation而没有报错的话，那么你可以确定你的梯度计算是正确的。

参考：[1] https://blog.csdn.net/york1996/article/details/81835873

[2] https://zhuanlan.zhihu.com/p/38475183

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

place

深拷贝的坑

pytorch in-place 引用深拷贝的坑的相关文章

Pytorch 0.4.0：可以通过三种方式在 CUDA 设备上创建张量。他们之间有什么区别吗？

我第三条路失败了 t3仍在CPU上不知道为什么 a np random randn 1 1 2 3 t1 torch tensor a t1 t3 to torch device cuda t2 torch tensor a t2 t2
如何在pytorch中打印Adadelta中的“实际”学习率

In short 在 pytorch 中使用 adadelta 优化器时我无法绘制 lr epoch 曲线因为optimizer param groups 0 lr 始终返回相同的值详细 Adadelta 可以仅使用一阶信息随时间动态
pytorch index_put_给出运行时错误：“索引”的导数未实现

这是后续问题这个问题 https stackoverflow com q 65584330 3337089 我尝试使用index put 如建议的答案 https stackoverflow com a 65584479 3337089 但
Python中的嵌入层：如何正确使用Torchsummary？

这是一个最低限度工作可重现的示例 import torch import torch nn as nn from torchsummary import summary class Network nn Module def init s
PipelineException：在输入中找不到 mask_token ([MASK])

我收到此错误 PipelineException 在输入中找不到 mask token MASK 当我运行这条线时 fill mask 汽车我在 Colab 上运行它我的代码 from transformers import BertT
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
使用 pytorch 获取可用 GPU 内存总量

我正在使用 google colab 免费 Gpu 进行实验并想知道有多少 GPU 内存可供使用 torch cuda memory allocated 返回当前占用的 GPU 内存但我们如何使用 PyTorch 确定总可用内存 PyT
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py

随机推荐

linux : Invalid or corrupt jarfile

今天用secureCRT登录服务器运行jar文件 xff0c 老是报错 xff1a Invalid or corrupt jarfile 原来是本地上传文件是以ASCII的方式上传到的 xff0c 结果造成jar文件格式错误把左下角的以
Mac “conda command not found” 解决方法

1 手动添加path 1 xff09 在终端terminal中操作 xff0c 找到文件 bash profile xff0c 编辑模式打开 sudo vi bash profile 2 xff09 手动写入conda的路径 export
Ubuntu22.04安装Qt6.3.0操作步骤

一安装步骤 1 安装Ubuntu22 04 直接到ubuntu网站 xff0c 下载该安装镜像 xff0c 在虚拟机下安装即可 2 更新ubuntu镜像下载源 2 1 更新操作在终端内运行 sudo apt update sudo ap
kali2021.3安装DVWA靶场

物理机的操作 xff1a Step1 xff1a 下载dvwa文件 Step2 xff1a 在物理机中将dvwa文件解压 xff08 记住解压的目录 xff0c 如 xff1a D DVWA master xff09 xff0c 将其改名d
入栈出栈规律·

相信大家都做过类似这样的题目 xff1a 已知入栈序列为 xff1a 1 2 3 4 5 xff0c 这5个数依次入栈 xff0c 出栈顺序时机任意则下列可能的出栈序列不正确的是 xff08 xff09 A 1 2 3 4 5 B 3
Application(EBS)开发整理(转)

Profile xff1a 一个 Profile 其实就是一个参数 xff0c 在开发员职责里面定义 xff0c 注意这个时候选择的 Application 仅仅是方便管理 xff0c 对以后的使用没有限制 xff1b 一个 Profile
静态存储区（BSS、数据段、代码段），堆，栈-----------------（划归在C语言）

进程 xff08 执行的程序 xff09 会占用一定数量的内存 xff0c 它或是用来存放从磁盘载入的程序代码 xff0c 或是存放取自用户输入的数据等等不过进程对这些内存的管理方式因内存用途不一而不尽相同 xff0c 有些内存是事先静态
UITabBarController显示多于5个标签时的如何直接显示视图而非More处理方式

使用UITabBarController多余4个标签时 xff0c 出现MoreNavigationController xff0c 很多开发者想直接显示视图 xff0c 而不想看到MoreNavigationController 下面说一
上采样操作及PixelShuffle

1 是什么 xff1f 论文 xff08 xff08 ESPCN xff09 Real Time Single Image and Video Super Resolution Using an Efficient Sub Pixel Co
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver问题排查

问题执行 xff1a nvidia smi 出现提示 xff1a NVIDIA SMI has failed because it couldn t communicate with the NVIDIA driver Make sure
服务器管理常用命令（Linux、进程管理、资源管理）

1 进程相关 xff08 找进程杀进程查占用 xff09 根据关键字找进程top grep keyword more 4迅速定位包含某个关键字的进程的pidpgrep l XXXRed Hat 里查看所有进程的命令ps ef根据PID查
AdaDSR（Deep Adaptive Inference Networks for Single Image Super-Resolution论文笔记）

Liu M Zhang Z Hou L et al Deep Adaptive Inference Networks for Single Image Super Resolution J arXiv preprint arXiv 2004
sudo 权限下依然使用新建的anaconda环境

问题 xff1a Ubuntu下执行sudo conda xff0c 出现 sudo conda command not found 的问题无法使用conda默认环境 xff0c 更是无法使用conda新建的环境解决方法 1 xff09
(NIPS2020)Unfolding the Alternating Optimization for Blind Super Resolution 笔记

NIPS2020 Unfolding the Alternating Optimization for Blind Super Resolution https github com greatlog DAN git 一建模现有盲超分方
神经网络的学习(Neural Networks: Learning)-反向传播算法

梯度下降算法中每一次迭代都按照如下公式进行更新 xff1a a是学习速率其中关键步骤是计算偏导数 xff0c 为了计算代价函数的偏导数 xff0c 我们需要采用一种反向传播算法 xff1a xff08 1 xff09 进行前向传播计算 x
将某一文件分区转换为swap交换分区

xff08 1 xff09 将目标文件分区中的数据移动到其他文件夹下 xff1a mv 原路径目标路径 xff08 2 xff09 卸除目前挂在Linux目录中的文件系统 xff1a umount v dev sda1 通过设备名卸载 x
Metalink

Metalink 来自 ITPUB博客 xff0c 链接 xff1a http blog itpub net 16860121 viewspace 716789 xff0c 如需转载 xff0c 请注明出处 xff0c 否则将追究法律责任
安装tensorflow时出现libcudnn.so.6:file too short

问题描述 xff1a ImportError usr local cuda 8 0 lib64 libcudnn so 5 file too short 在Ubuntu16 04 cuda8 0 cudnn6 0情况下安装tensorflo
Contextual loss

Mechrez R Talmi I Zelnik Manor L The contextual loss for image transformation with non aligned data J arXiv preprint arX
pytorch in-place 引用深拷贝的坑

一引用拷贝 pytorch引用和深拷贝 xff08 1 xff09 原来 Torch 中为了提高速度 xff0c model forward 操作之后赋予的变量是不给这个变量开盘新的存储空间的 xff0c 而是引用就相当于起了个别

pytorch in-place 引用 深拷贝的坑

pytorch in-place 引用 深拷贝的坑 的相关文章

随机推荐

热门标签

pytorch in-place 引用深拷贝的坑

pytorch in-place 引用深拷贝的坑的相关文章