CUDA 与 DataParallel：为什么有区别？

2024-06-19

我有一个简单的神经网络模型，我应用cuda() or DataParallel()在模型上如下所示。

model = torch.nn.DataParallel(model).cuda()

OR,

model = model.cuda()

当我不使用 DataParallel 时，只需将模型转换为cuda()，我需要将批量输入显式转换为cuda()然后将其交给模型，否则返回以下错误。

torch.index_select 收到无效的参数组合 - got (torch.cuda.FloatTensor, int, torch.LongTensor)

但是使用 DataParallel，代码可以正常工作。其余的其他事情都是一样的。为什么会出现这种情况？为什么当我使用 DataParallel 时，我不需要将批量输入显式转换为cuda()?

因为，DataParallel 允许 CPU 输入，因为它的第一步是将输入传输到适当的 GPU。

信息来源：https://discuss.pytorch.org/t/cuda-vs-dataparallel-why-the-difference/4062/3 https://discuss.pytorch.org/t/cuda-vs-dataparallel-why-the-difference/4062/3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

CUDA 与 DataParallel：为什么有区别？的相关文章

在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
运行时错误：大小不匹配，m1：[4 x 3136]，m2：[64 x 5]位于c：\ a \ w \ 1 \ s \ tmp_conda_3.7_1

我使用 python 3 当我插入变换随机裁剪大小 224 时它会给出未匹配错误这是我的代码 https github com kajasumanie medical plant classification blob master i
如何将 35 类城市景观数据集转换为 19 类？

以下是我的代码的一小段使用它我可以在城市景观数据集上训练名为 lolnet 的模型但数据集包含 35 个类别标签 0 34 imports trainloader torch utils data DataLoader datase
无法在 Windows 10 上构建 Detectron2

尽管 Windows 上的 Detectron2 没有官方支持但有很多可用的说明我尝试按照这些说明进行操作但最终出现了相同的错误这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
如何让火车装载机使用特定数量的图像？

假设我正在使用以下调用 trainset torchvision datasets ImageFolder root imgs transform transform trainloader torch utils data DataLoa
PyTorch 如何计算二阶雅可比行列式？

我有一个正在计算向量的神经网络u 我想计算关于输入的一阶和二阶雅可比矩阵x 单个元素有人知道如何在 PyTorch 中做到这一点吗下面是我项目中的代码片段 import torch import torch nn as nn class
Pytorch RuntimeError：张量 a (4) 的大小必须与非单维 0 处张量 b (3) 的大小匹配

我使用的代码来自here https www learnopencv com image classification using transfer learning in pytorch 训练模型来预测印刷样式编号0 to 9 idx t
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
如何在 Google Colab 上安装 PyTorch v1.0.0+？

PyTorch v1 0 0 稳定版是发布于 2018 年 12 月 8 日 https github com pytorch pytorch releases tag v1 0 0成为之后7个月前宣布 https code fb com

随机推荐

IIS7应用程序请求路由（arr反向代理）与托管模块相结合 - 超时

我正在尝试构建一个代理该代理可以为内部站点隐藏来源的请求提供服务但同时检查数据包并异步对其进行后处理例如假设所有 SOAP 调用http www foo com http www foo com将会去http 192 168 1
更新到 1.11.0 后，自动完成功能要求您在 iOS 中单击两次

使用 jQuery 2 1 0 和 jQuery ui 1 11 0 在 iOS 7 iPhone 和 iPad Mini 中测试适用于 Android 和常规浏览器问题我们最近从 jQuery UI 1 10 0 升级到 1 11
如何在Python字符串中替换括号及其中的文本

我有两个这样的字符串 string1 Today I went to the market to pick up some fruit string2 Today I went to school to learn algebra and
python中的StringIO实际用途是什么？

StringIO到底是用来做什么的我一直在互联网上寻找一些例子然而几乎所有的例子都非常抽象他们只是展示如何使用它但它们都没有表明为什么和在什么情况下应该将使用它附注不要与 stackoverflow 上的这个问题混
立即重新部署 Java EE 应用程序

我对 Java EE 很陌生一直在为部署过程的缓慢而苦苦挣扎并想知道我是否做错了什么我对 Django 有丰富的经验其中代码的更改会立即发生而且似乎热部署 Java EE 应用程序有点令人困惑有多种东西声称可以热部署 Glass
根据一个属性对数组进行排序[重复]

这个问题在这里已经有答案了我有一个名为 NSMutableArrayallItems其中有以下内容ProductData目的每个对象都有cid cname ctype and cimage 正如您在下面看到的 json 对象没有按顺序出
当 Meteor 响应式模板因数据订阅更改而更新时，如何防止窗口焦点发生变化？

我有一个很长的页面它包含对模板的引用其中一些模板呈现数据页面上的模板之一已订阅集合当集合更改时该模板中的视图将呈现那些已添加或更改的项目它做得很好并且不会重新加载页面问题在于当数据呈现时页面焦点会跳转到该模板模板呈现的
使用 pin_ptr 时发生访问冲突？

当我使用 pin ptr 在本机 C 代码中传递数组时出现访问冲突代码如下 array
为什么 ᏌᏊ ᎢᏳᎾᎵᏍᏔᏅ ᏍᎦᏚᎩ 是美国的本土名称？

当我使用这段代码时 var ri new RegionInfo us var nativeName ri NativeName why is nativeName然后是字符串 in Cherokee https en wikipedia o
关闭应用程序而没有.net框架的错误提示窗口

在我的项目中代码处理未处理的异常如下所示 static void FnUnhandledExceptionEventHandler object sender UnhandledExceptionEventArgs UnhandledE
Azure Functions 中通过整数 SQL 查询 DocumentDB 不起作用

我在 Azure Functions 中使用 JavaScript 语言当使用 Cosmos DB 作为输入时我无法通过整数作为变量进行查询例如我有以下内容使用 Azure Cosmos DB 作为我的输入公司的功能设置这是
Android：每次单击导航抽屉项时创建一个新片段更好，还是加载以前创建的片段更好？

我正在为 Android 实现标准导航抽屉模式用户可以从抽屉中导航到大约 10 个片段目前每次单击不同的导航抽屉项目时我都会创建一个新的片段如下所示 When a new navigation item at index is c
您如何管理项目生命周期？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案您如何管理项目生命周期例如您从模板开始吗您是否使用 SVN 等版本控制作为权威来源您是否归档项目如果归档何时归档以及如何归档当项目
设计 React Hooks 可防止 React-hooks/exhaustive-deps 警告

我正在设计一个钩子仅当钩子依赖项发生变化时才获取数据它按预期工作但我收到了 linter 警告 React Hook useEffect was passed a dependency list that is not an array
PyCrypto：仅使用文件中的公钥解密（无私钥+公钥）

大家好我正在尝试使用 RSA 公钥和私钥以及加密解密PyCrypto我遇到了一个对我来说似乎有点奇怪的问题它现在的工作方式可能很有意义但我对 RSA 非对称加密了解不多这就是它让我困惑的原因这是我遇到的无法解密只有公钥的东西事
通过 osql.exe 运行脚本时出现问题

我尝试以这种格式运行我的软件的更新脚本 osql exe i path to script U 用户 P 密码 S sqlserver 位置 d 数据库名称 n b 大多数脚本的格式相同并且都以 GO 结尾其中很多都运行得很好但随机脚
如何从 WifiP2pDeviceList 获取 wifi direct 设备名称

我想在执行请求对等点时获取 wi fi direct 名称这是我的代码 if WifiP2pManager WIFI P2P PEERS CHANGED ACTION equals action Log d tag success dis
如何让Spring RabbitMQ创建一个新的队列？

根据我对rabbit mq的有限经验如果您为尚不存在的队列创建新的侦听器则会自动创建该队列我正在尝试将 Spring AMQP 项目与rabbit mq 一起使用来设置侦听器但出现错误这是我的 xml 配置
AngularJS 创建全局键盘快捷键的方式是什么？

我想我应该使用指令但将指令添加到正文似乎很奇怪但监听文档上的事件执行此操作的正确方法是什么更新找到 AngularJS UI 并看到their https docs angularjs org api ng directive n
CUDA 与 DataParallel：为什么有区别？

我有一个简单的神经网络模型我应用cuda or DataParallel 在模型上如下所示 model torch nn DataParallel model cuda OR model model cuda 当我不使用 DataPara

CUDA 与 DataParallel：为什么有区别？

CUDA 与 DataParallel：为什么有区别？ 的相关文章

随机推荐

热门标签

CUDA 与 DataParallel：为什么有区别？的相关文章