为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

2024-04-12

nn.Module.cuda()将所有模型参数和缓冲区移动到 GPU。

但为什么不是模型成员张量呢？

class ToyModule(torch.nn.Module):
    def __init__(self) -> None:
        super(ToyModule, self).__init__()
        self.layer = torch.nn.Linear(2, 2)
        self.expected_moved_cuda_tensor = torch.tensor([0, 2, 3])

    def forward(self, input: torch.Tensor) -> torch.Tensor:
        return self.layer(input)

toy_module = ToyModule()
toy_module.cuda()

next(toy_module.layer.parameters()).device
>>> device(type='cuda', index=0)

对于模型成员张量，设备保持不变。

>>> toy_module.expected_moved_cuda_tensor.device
device(type='cpu')

如果您在模块内定义张量，则需要将其注册为参数或缓冲区，以便模块知道它。

参数是要训练的张量，并将通过以下方式返回model.parameters()。它们很容易注册，您所需要做的就是将张量包装在nn.Parameter输入，它将自动注册。请注意，只有浮点张量可以作为参数。

class ToyModule(torch.nn.Module):
    def __init__(self) -> None:
        super(ToyModule, self).__init__()
        self.layer = torch.nn.Linear(2, 2)
        # registering expected_moved_cuda_tensor as a trainable parameter
        self.expected_moved_cuda_tensor = torch.nn.Parameter(torch.tensor([0., 2., 3.]))

    def forward(self, input: torch.Tensor) -> torch.Tensor:
        return self.layer(input)

Buffers是将在模块中注册的张量，因此方法如下.cuda()会影响他们，但他们会not被返回model.parameters()。缓冲区不限于特定的数据类型。

class ToyModule(torch.nn.Module):
    def __init__(self) -> None:
        super(ToyModule, self).__init__()
        self.layer = torch.nn.Linear(2, 2)
        # registering expected_moved_cuda_tensor as a buffer
        # Note: this creates a new member variable named expected_moved_cuda_tensor
        self.register_buffer('expected_moved_cuda_tensor', torch.tensor([0, 2, 3])))

    def forward(self, input: torch.Tensor) -> torch.Tensor:
        return self.layer(input)

在上述两种情况下，以下代码的行为相同

>>> toy_module = ToyModule()
>>> toy_module.cuda()
>>> next(toy_module.layer.parameters()).device
device(type='cuda', index=0)
>>> toy_module.expected_moved_cuda_tensor.device
device(type='cuda', index=0)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

GPU

tensor

为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？的相关文章

理解Python中的元类和继承[重复]

这个问题在这里已经有答案了我对元类有一些困惑具有继承性 class AttributeInitType object def init self kwargs for name value in kwargs items setattr
隐藏控制台并执行 python 脚本

我正在尝试使用 pyinstaller 在 Windows 10 上使用 pyqt5 模块编译在 python 3 中构建的 python 脚本该脚本在运行时隐藏窗口为了编译我的脚本我执行了以下命令 pyinstaller onefi
MySQL 的 read_sql() 非常慢

我将 MySQL 与 pandas 和 sqlalchemy 一起使用然而它的速度非常慢对于一个包含 1100 万行的表一个简单的查询需要 11 分钟以上才能完成哪些行动可以改善这种表现提到的表没有主键并且仅由一列索引 fro
如何/在哪里发布 Python 包

如果一个人创建了一个有用的 Python 包那么如何在哪里发布宣传它以供其他人使用我已经把它放到了 github 上但几周后谷歌也没有找到它包装整洁完整我制作它供我个人使用不与其他人分享将是一种耻辱这是 PyPI 指南 h
Python：如何删除圆括号内的文本？

我试过了但没用 return re sub myResultStats text 建议 thanks 尝试这个 return re sub myResultStats text 括号表示捕获组因此您必须转义它们
通过 pyodbc 连接到 Azure SQL 数据库

我使用 pyodbc 连接到本地 SQL 数据库该数据库工作正常 SQLSERVERLOCAL Driver SQL Server Native Client 11 0 Server localdb v11 0 integrated se
使用python同时播放两个正弦音

我正在使用 python 来播放正弦音音调基于计算机的内部时间以分钟为单位但我想根据秒同时播放一个音调以获得和谐或双重的声音这就是我到目前为止所拥有的有人能指出我正确的方向吗 from struct import pack fr
将带有非字符串关键字的 dict 传递给 kwargs 中的函数

我使用具有签名功能的库f args kwargs 我需要在 kwargs 参数中传递 python dict 但 dict 不包含关键字中的字符串 f 1 2 3 4 Traceback most recent call last File
将图像转换为二进制流

我的应用程序有两个方面一方面我使用 C 来使用 Pleora 的 EBUS SDK 从相机读取帧当第一次接收到该流时在将缓冲区转换为图像之前我能够一次读取 16 位流以便对每个像素执行一些计算即每个像素都存在一个 16 位数据块
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
python中remove方法的安全使用

我从列表继承了一个 UserList 类并实现了以下方法来删除标记为已删除的条目 def purge deleted self for element in list iter self if ele mark deleted lt 1 s
从文件中读取单词并放入列表中

本质上我有一个巨大的文件所有文件包含每行多个单词每个单词用空格分隔有点像这样 WORD WORD WORD WORD ANOTHER WORD SCRABBLE BLAH YES NO 我想要做的是将文件中的所有单词放入一个巨大的列
Python、cPickle、酸洗 lambda 函数

我必须像这样腌制一组对象 import cPickle as pickle from numpy import sin cos array tmp lambda x sin x cos x test array tmp tmp tmp tm
在 Python 中将 int 转换为 ASCII 并返回

我正在为我的网站制作一个 URL 缩短器我当前的计划我愿意接受建议是使用节点 ID 来生成缩短的 URL 因此理论上节点 26 可能是short com z 节点 1 可能是short com a 节点 52 可能是short c
使用 pythons strftime 显示日期，例如“5 月 5 日”？ [复制]

这个问题在这里已经有答案了可能的重复 Python 日期顺序输出 https stackoverflow com questions 739241 python date ordinal output 在Python中 time strf
使用 PIL 合并图像时模式不匹配

我正在传递 jpg 文件的名称 def split image into bands filename img Image open filename data img getdata red d 0 0 0 for d in data L
使用 PuLP 进行线性优化，变量附加条件

我必须用 Pull 解决 Python 中的整数线性优化问题我解决了基本问题现在我必须添加额外的约束有人可以帮助我用逻辑指示器添加条件吗逻辑限制是如果 A gt 20 则 B gt 5 这是我的代码 from pulp impor
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
应用程序的外观 - Py2exe / wxPython

所以我的问题是我的应用程序的外观和感觉因为它看起来像一个旧的外观应用程序它是一个 wxPython 应用程序在 python 上它运行良好并且看起来不错但是当我使用 py2exe 将其转换为 exe 时外观很糟糕现在我知道如果你
如何访问模板缓存？ - 姜戈

I am 缓存 HTML在几个模板内例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制有任

随机推荐

使用 While() 结构时 Gridview 不会填充。 C# ASP.Net

我在使用此网格视图时遇到问题我正在用查询填充它但是如果我使用 while reader Read 结构它就不会填充甚至不会出现没有 while 结构它工作得很好但是我需要访问两个特定字段代码如下 SqlDataReader
getLastknownLocation() 在 nexus 上返回 null 值

我正在开发基于位置的项目我使用以下代码我正在为该项目使用 google api 8 lm requestLocationUpdates LocationManager GPS PROVIDER 0 0 this currloc lm g
为什么我们应该总是从函数返回值？

我不是一个编程高手但多次听程序员说我们应该始终从函数返回值我想知道原因函数不需要返回任何内容如果您查看 C 函数您会发现其中许多函数不需要返回任何内容好吧不是明确地 void nonReturningFunction cons
Python：有限制的非线性优化（Gekko？）

我希望能够用Python解决以下问题给定观测数据 x 1 x n 和已知的固定目标 B 和公差 E 求解参数 a0 a1 和 a2 从而最小化总和 w i 2 其中 w i exp a0 a1x i a2x i 2 具有以下两个限制 s
拆分包含两者的字符串中的数字和字母

我正在尝试分割以下或类似字符串 08 27 2015 07 25 00AM 目前我使用 var parts date split 0 9a zA Z g 这导致 02 27 2012 03 25 00AM 问题在于00AM部分我也想分
在 Visual Studio 中的项目之间共享预编译头

我有一个包含许多 Visual C 项目的解决方案所有项目都使用 PCH 但有些项目打开了特定的编译器开关以满足项目特定的需求这些项目中的大多数在各自的 stdafx h 中共享相同的标头集 STL boost 等我想知道是否可以在项
网页抓取、屏幕抓取、数据挖掘技巧？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
在 Python (2.7) 中比较两个相同的对象返回 False

我在Python中有一个函数叫做object from DB 该定义并不重要只是它采用 ID 值作为参数使用sqlite3库从 db 文件中的表中提取匹配值然后在对象初始化时使用这些值作为参数使用此函数不会改变数据库鉴于此这个示
有向加权图的邻接表

我使用邻接表来表示有向加权图并基于以下提供的示例代码this https stackoverflow com questions 58306 graph algorithm to find all connections between
使用 ggplot2 绘制“序列徽标”？

是否合理可能绘制一个序列标志图 http en wikipedia org wiki Sequence logo使用ggplot2 有一个基于网格的包可以做到这一点称为 seqLogo http www bioconductor
使用枚举对结构进行分组

在 Rust 中应该如何对相关结构进行分组以便函数签名可以接受多种不同类型同时引用方法体内的具体类型为了简单起见设计了以下示例 enum Command Increment quantity u32 Decrement quant
使用CreateProcess调用exe文件？

一直尝试从我的 Visual Studio C 应用程序调用 Truecrypt exe 但是CreateProcess只是不工作 GetLastError shows 127 目的是调用exe不显示命令窗口请帮忙我尝试过搜索并阅读Cr
读取 XML 节点的值

我需要获取 XML 文件中节点的值我的 XML 文件如下所示
嵌入可编辑的 Google 文档电子表格，无需标题和工具栏

我需要在网页上嵌入 Google 文档电子表格但它只需是可编辑的单元格顶部没有 Google 导航和工具栏我找不到用于在任何地方嵌入 Google 文档的查询字符串变量的引用但似乎删除工具栏等的唯一方法是在查询字符串中添加 outp
如何将 Win32 异常代码转换为字符串？

我很不情愿地再次处理 Win32 结构化异常我正在尝试生成一个描述异常的字符串大部分都很简单但我坚持一些基本的事情如何转换异常代码 GetExceptionCode 或者ExceptionCode的成员EXCEPTION RECOR
vim命令模式下单引号和双引号有区别吗？

在我的 vim 中我可以使用 sed s 当我使用时得到错误的输出 sed s sed e expression 1 char 0 no previous regular expression vim命令模式下单引号和双引号有区别吗在我
如何在SWT文本组件中实现自动隐藏滚动条

我有一个 SWT Text 组件我为其设置了SWT MULTI SWT V SCROLL and SWT H SCROLL需要时显示滚动条我发现即使内容小于文本组件滚动条在禁用状态下也可见有什么办法可以自动隐藏滚动条吗就像java
如果 useEffect 侦听非状态值，那么依赖项数组中包含非状态值会产生什么效果？

每一次Comp重新渲染 rand将是不同的值会不会触发useEffect function Comp const rand Math random useEffect gt do stuff rand 任何变量都可以放入依赖数组中 sta
我无法使用 IIS 和 IISNode 从 Windows Server 2012 外部访问我的网站

我买了一台新的专用服务器我有一个 MEAN Stack 应用程序 Node js Angular MongoDB Express 并且想要利用 IIS 来发布我的 Web 应用程序我跟着本指南 http harveywilliams n
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se

为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？ 的相关文章

随机推荐

热门标签

为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？的相关文章