pytorch采用GPU加速方法

2023-10-29

在进行深度学习训练模型时，对于计算量小一些的模型，是可以在CPU上进行的。但是当计算量比较大时，我们希望利用GPU并行计算的能力去加快训练的速度。

查看GPU版本号

import torch

print(torch.__version__)  # 查看torch当前版本号

print(torch.version.cuda)  # 编译当前版本的torch使用的cuda版本号

print(torch.cuda.is_available())  # 查看当前cuda是否可用于当前版本的Torch，如果输出True，则表示可用

查看GPU数量

def try_gpu(i=0): 
    """如果存在，则返回gpu(i)，否则返回cpu()"""
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f'cuda:{i}')
    return torch.device('cpu')

def try_all_gpus(): 
    """返回所有可用的GPU，如果没有GPU，则返回[cpu(),]"""
    devices = [torch.device(f'cuda:{i}')
             for i in range(torch.cuda.device_count())]
    return devices if devices else [torch.device('cpu')]
# 0号GPU是否存在，10号GPU是否存在
try_gpu(), try_gpu(10), try_all_gpus()

指定GPU

import torch
from torch import nn

torch.device('gpu'), torch.cuda.device('cuda'), torch.cuda.device('cuda:1')

GPU计算张量

# 创建一个张量Y在1号GPU
Y = torch.rand(2, 3, device=try_gpu(1))
Z = X.cuda(1)  # 将X的内容复制在1号GPU的Z
print(X)
print(Z)
tensor([[1., 1., 1.],
        [1., 1., 1.]], device='cuda:0')
tensor([[1., 1., 1.],
        [1., 1., 1.]], device='cuda:1')

指定GPU计算神经网络模型

from torch import nn

net = nn.Linear(3, 1)
print(list(net.parameters())[0].device) # cpu

net.cuda(0)
print(list(net.parameters())[0].device) # cuda:0

net2 = nn.Linear(3, 1, device = torch.device('cuda' if torch.cuda.is_available() else 'cpu'))
print(list(net2.parameters())[0].device) # cuda:0

net3 = nn.Linear(3, 1).to(torch.device('cuda' if torch.cuda.is_available() else 'cpu'))
print(list(net3.parameters())[0].device) # cuda:0

net3 = net3.cpu()
print(list(net3.parameters())[0].device) # cpu

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

深度学习

python

pytorch采用GPU加速方法的相关文章

检测到通过 ChromeDriver 启动的 Chrome 浏览器

我正在尝试在 python 中使用 selenium chromedriver 来访问 www mouser co uk 网站然而从第一次拍摄开始它就被检测为机器人有人对此有解释吗此后我使用的代码 options Options
在 Pandas 中，如何从基于另一个数据框的数据框中删除行？

我有 2 个数据框一个名为 USERS 另一个名为 EXCLUDE 他们都有一个名为电子邮件的字段基本上我想删除 USERS 中包含 EXCLUDE 中包含电子邮件的每一行我该怎么做您可以使用boolean indexing
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

mysql 可以承受多少人_mysql每秒最多能插入多少条数据 ? 死磕性能压测

前段时间搞优化最后瓶颈发现都在数据库单点上问DBA 给我的写入答案是在1W 机械硬盘左右联想起前几天infoQ上一篇文章说他们最好的硬件写入速度在2W后也无法提高 SSD硬盘但这东西感觉从来没证实过故一时兴起弄台虚拟机压测起来
HDLBits 系列（6）——Sequential Logic（Latches and Flip-Flops）

目录 3 2 Sequential Logic 3 2 1 Latches and Flip Flops 1 D flip flop 2 D flip flops 3 DFF with reset 4 DFF with reset valu
AOP常用的几种增强方式，各自的特点（代码辅助）？

1 前置增强又称前置通知前置增强使用 Befor注解标识增强方法优先于目标方法执行前置增强方法 Before execution int mul int int 执行方法之前执行下面的方法 public void before Jo
vue使用vant的list组件使用

模板代码
性能测试—性能测试方案设计思路总结

一需求分析 1 测试目的为什么测目的在于测试系统相关性能能否满足业务需求通常分以下两种情况 1 新项目上线 2 老项目优化如果是老项目优化可考虑是否存有历史测试方案如果有可以参考或许可以省事很多 2 测试对象要测啥测试对
RK开发板的USB连接（Ubuntu）

一安装连接工具 sudo apt get install putty 二启动putty工具 sudo putty 三连接usb 并查看相关的信息查看接入的是否有usb ls dev tty 显示如下含有usb接口 dev ttyU
JVM的GC ROOTS有哪些？

jvm垃圾回收是根据可达性分析算法来判断堆里面的对象是否有用可达性分析算法是从GC ROOTS扫描对象引用链来筛选出有用的对象扫面完成后回收掉无用的对象 jvm的GC ROOTS有哪几个地方呢 1 虚拟机栈局部变量表中引用的对象
寒假训练第三节数据结构基础总结

栈基本操作 1 判断栈空 2 判断栈满 3 进栈 4 出栈判断栈空操作 s gt top 1 当栈顶指向 1时说明该栈为空判断栈满操作 s gt top MAXEN 1 当栈顶为栈长减一时说明栈为满进栈 s gt top s g
react-native之ART绘图详解

背景在移动应用的开发过程中绘制基本的二维图形或动画是必不可少的然而考虑到Android和iOS均有一套各自的API方案因此采用一种更普遍接受的技术方案更有利于代码的双平台兼容 art是一个旨在多浏览器兼容的Node style
PF_INET AF_INET

http blog csdn net csdn zc article details 7656445 在写网络程序的时候建立TCP socket sock socket PF INET SOCK STREAM 0 然后再绑定本地地址或连接
【C语言】简易登录注册系统（登录、注册、改密、文件操作）

概述本登录注册系统通过使用C语言中的结构体函数文件操作以及指针等设计与实现了一个小型用户登录注册系统的登录注册修改密码等基本功能本系统全部功能基本运行良好用户界面友好操作简单使用方便但系统仍然有不完善之处例如在隐藏用
【零基础学爬虫】用python爬取小说

文章目录前言一先上效果图二 bs4学习 1 原理 2 运用 3 数据解析 4 属性定位 5 获取标签之间的文本数据 6 获取标签中的属性值三开始爬小说一般步骤 1 获取url 2 UA伪装 3 获取cookie 4 请求网站
Python3爬虫---抓取英雄联盟的所有英雄皮肤

usr bin env python coding utf 8 author Chris iven Python version 3 6 1 分析LOL官网行为发现这个网页的所有数据都是经过js生成的意思就是说他的数据全部不在该网页里
电脑如何搞副业？给大家分享五个电脑副业

如今的电脑曾经渐渐的开端提高起来不论我们是办公还是在家简直每个人都是会用到这样的东西他也是改动了我们的赚米方式如今很多人都是在家用电脑开端赚米那么一台电脑怎样挣米有一台电脑怎样挣米的办法有哪些那么接下来就给你们带来电脑挣米的办
my学习OC--数组对象 NSArray NSMultableArray

数组是有序集合只能存放对象数组有下标 index 的概念靠index来索引元素下标从0开始数组分为不可变数组 NSArray 和可变数组 NSMutableArray 不可变数组 NSArray 创建数组对象 1 创建数组对象 2
求素数

题目描述求 100 200 之间的全部素数输入无输出 100 200 之间的全部素数一个素数占一行样例输入无样例输出 101 103 107 109 113 127 131 137 139 149 151 157 163 1
Otsu详细算法解析

前言无一 OTSU算法是什么 OTSU算法又名最大类间方差法是由日本学者大津展之于1979 年提出利用整副图像的直方图特性选择全局阈值T 文字图片和背景通常会出现两个驼峰确定一个灰度值作为阈值将灰度值小于阈值的点作为目标大于
Bootstrap,LayUI,EasyUI的对比

Bootstrap样式更美观更适合前端 EasyUI功能强大样式一般性能比bootStrap好故后端界面用的较多
git push origin master和git push的区别

1 git push origin master 指定远程仓库名和分支名 2 git push 不指定远程仓库名和分支名这个命令看起来好像比上面那个简单但是却是很模糊的很容易混淆不特定指出远程仓库名和分支名一般是使用默认配置
pytorch采用GPU加速方法

在进行深度学习训练模型时对于计算量小一些的模型是可以在CPU上进行的但是当计算量比较大时我们希望利用GPU并行计算的能力去加快训练的速度查看GPU版本号 import torch print torch version 查看tor

pytorch采用GPU加速方法

查看GPU版本号

查看GPU数量

指定GPU

GPU计算张量

指定GPU计算神经网络模型

pytorch采用GPU加速方法 的相关文章

随机推荐

热门标签

pytorch采用GPU加速方法的相关文章