神经网络（十四）Pytorch完整模型训练和调用GPU加速

2023-11-13

一、模型的训练

Step1.准备数据集

import torchvision

train_data = torchvision.dataset.CIFAR10("../data",train=True,
        transform=torchvision.ToTensor，download=True)    --载入训练集
test_data = torchvision.dataset.CIFAR10("../data",train=False,
        transform=torchvision.ToTensor，download=True)    --载入测试集

Tips.获取数据集长度

train_data_size = len(train_data)

Step2.加载数据集

train_dataloader = DataLoader(train_data,batch_size=64)
test_dataloader = DataLoader(test_data,batch_size=64)

Step3.搭建网络

class MyNerNet(nn.Moduel):
    def __init__(self):
        super(MyNerNet,self).__init__()    --基类初始化
        self.model = nn.Sequential(                  --网络序列器
                            nn.Cov2d(3,32,5,1,2),    --卷积
                            nn.MaxPool2d(2),         --池化
                            nn.Conv2d(32,32,5,1,2),
                            nn.MaxPool2d(2),
                            nn.Conv2d(32,64,5,1,2),
                            nn.MaxPool2d(2),
                            nn.Flatten(),            --展平
                            nn.Linear(64*4*4,64),    --线性层
                            nn.Linear(64,10)         --线性层代分类器)

    def forward(self,x):    --传递函数
        return self,model(x)

可将网络相关代码放置在一个单独的文件中，但是在主文件中需要使用引用

from model import *    --将model文件中所有的内容引用

Step4.创建损失函数和优化器

loss_fn = nn.CrossEntropyLoss()    --交叉损失函数

learing_rate=0.01    --学习速率，外置方便修改
optimizer = torch.optim.SGD(MyNerNet.parameters(),lr=learing_rate)    --随机梯度下降

Step5.训练+测试

--设置一些计数器
    total_train_step = 0    --记录训练次数
    total_test_step = 0    --记录训练次数
    epoch = 10    --训练轮数

--开始训练
    for i in range(epoch):
        print("---第{}轮训练---".format(i+1))
        for data in train_dataloader
            imgs,targets = data    --拆包
            outputs = mynet(imgs)    --使用网络
            loss = loss_fn(outputs,targets)    --计算损失函数

            optimizer.zero_grad()    --梯度清零
            loss.backforward()    --前向传递
            optimizer.step()    --逐步优化

            total_train_step += 1    --计数
            print("训练次数：{}，Loss：{}".format(total_train_step,loss.item()))    
                --展示//也可以使用TensorBorad进行展示

    --开始测试
        total_test_loss = 0    --总损失函数计数
        with torch.no_grad():    --不设置梯度（保证不进行调优）
            for data in test_dataloader:
                imgs,targets = data    --拆包
                outputs = mynet(imgs)    --使用网络
                loss = loss_fn(outputs,targets)    --计算损失函数
                total_test_loss = total_test_loss + loss  --添加此次部分损失函数
        print("整个测试集上的Loss：{}".format(total_test_loss))
        total_test_step = total_test_step + 1

    --保存每轮的模型
        torch.save(mynet,"MyNerNet_Ver{}.pth".format(total_train_step))

Tips.正确率展示（用于分类问题）

outputs = torch.Tensor([[0.1,0.2],
                        [0.3,0.4]])

preds = outputs.argmax(1)    --最大延展
targets = Torch.Tensor([0,1])    --真实输入

print(preds == targets)    --检验(对应位置是否相等),输出正确的个数

二、模型训练需要注意的事项

1.网络训练/测试模式

当网络中含有Dropout、BatchNorm时，必须调用

但是如果没有对应的内容不是必须的，使用无效

mynet.train()    --训练模式
mynet.test()    --测试模型

2.测试时关闭梯度

测试之前需要调用这行代码，关闭网络的梯度

with torch.no_grad():

三、使用GPU进行训练加速

1.方式一：在原有的网络模型、数据(输入、标注)、损失函数中调用.cuda()函数即可

mynet = mynet.cuda()    --对网络调用

loss_fn = loss_fn.cuda()    --对损失函数调用

imgs = imgs.cuda()    --仅对部分数据生效（数据集的输入数据）

但如果电脑没有N卡就会报错，最好在代码前部加上验证函数

if torch.cuda.is_available()
    mynet = mynet.cuda()    --有GPU再将网络进行转移

2.方式二：在原有的网络模型、数据(输入、标注)、损失函数中调用.to(device)函数--流转到其他设备

Device = torch.device("cpu")    --调用CPU
Device = torch.device("cuda")    --调用GPU
Device = torch.device("cuda:0")    --调用第一块GPU（当存在多块GPU时）

mynet.to(device)    --流转到设备

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络

学习笔记

Pytorch

深度学习

神经网络（十四）Pytorch完整模型训练和调用GPU加速的相关文章

尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
PyTorch LSTM 中的“隐藏”和“输出”有什么区别？

我无法理解 PyTorch 的 LSTM 模块以及类似的 RNN 和 GRU 的文档关于输出它说输出输出 h n c n 输出 seq len batch hidden size num directions 包含RNN最后一层的
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
尝试将 cuda 与 pytorch 一起使用时出现运行时错误 999

我为我的 Geforce 2080 ti 安装了 Cuda 10 1 和最新的 Nvidia 驱动程序我尝试运行一个基本脚本来测试 pytorch 是否正常工作但出现以下错误 RuntimeError cuda runtime erro
导入pytorch时，未安装microsoft Visual C++ Redistributable

我在一台带有 GPU 的 Windows 机器上工作我已经在 conda 环境中安装了 pytorch conda install pytorch torchvision cudatoolkit 10 1 c pytorch 然后我运行
PyInstaller 可执行文件无法获取 TorchScript 源代码

我正在尝试使包含 PyTorch 的脚本在 Windows 中可执行我的脚本的导入是 import numpy core multiarray which is a workaround for ImportError numpy cor
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call
无法在jupyter笔记本中导入torch

系统 macOS 10 13 6 蟒蛇 3 7 蟒蛇3 我遇到麻烦时import torch在 jupyter 笔记本中 ModuleNotFoundError No module named torch 这是我安装 pytorch 的方法
Pytorch 培训； “运行时错误：PyTorch 和 torchvision 版本不兼容......”

解决方案在底部我想通过本教程进行对象检测 https towardsdatascience com building your own object detector pytorch vs tensorflow and how to ev
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In

随机推荐

c++实现引用计数

概述当有指针指向同一块内存空间时计数器加1 没增加一个指向该内存空间的指针计数器加1 同理当原本指向该内存空间的指针指向另一块内存计数器减1 被指向的另一个内存的计数器加1 下面是一个引用计数的一种实现示例直接上代码总共分为
uni-app项目中如何使用scss less

前言由于公司业务调整特意学习下uni项目框架其实根据官方api就是实现很多功能其实都是一些小坑要走下面来说一下uni项目中如何使用scss vue编写中我们可以直接使用下面这样方法多方便
Eclispse中Run on Server窗口让选择Server，但已经存在的选择不了

对于这种问题通常是因为版本不匹配造成的 jdk版本 Dynamic Web Modules版本只要改到相应版本就好了 jdk7 时Dynamic Web Modules应设为2 5 如果无法修改可以新建一个工程在新建工程时选择Dyn
记忆深处有尘埃——Memory Compiler

Memory是大家Floorplan中经常使用到一个器件而且需要花费不少时间去摆放它 Memory的种类很多各种类型还分别具有不同的参数那大家有没有想过对一个设计来说我们是如何去选择合适的memory类型不同的类型有什么区别在
作为一名程序员，如何开展自己的副业？月赚三万的真实故事

作为一名程序员除了敲代码之外还应该有一些副业我们都是程序员大多数都是普通人都在替别人打工虽然收入在别人眼中挺高但是连个首付都付不起这时首先得要发展副业与其拿着死工资还不如做些啥今天我所说的不是教大家如何去挣很多钱而
mavon-editor 页面回显使用turndown将HTML转为markdown

1 安装npm install turndown npm install turndown 2页面使用 v model markdowntext
后端接口返回近万条数据，前端渲染缓慢，content Download 时间长的优化方案

前言性能优化是前端绕过不去的一道门槛甚是重要最近一年也很少有机会在项目中进行前端性能优化一直在忙于业务开发最近终于是来了机会遇到了这样的场景心里也甚是激动写个随笔记录下性能优化的过程及逻辑有需要的可以参考下场景后端
机器学习实战笔记8(kmeans)

前面的7次笔记介绍的都是分类问题本次开始介绍聚类问题分类和聚类的区别在于前者属于监督学习算法已知样本的标签后者属于无监督的学习不知道样本的标签下面我们来讲解最常用的kmeans算法 1 kmeans算法算法过程 Kmeans中
Spring核心思想 IOC 、 AOP

Spring核心思想 IOC AOP IOC 1 什么是IOC 2 IOC解决了什么问题 IoC解决对象之间的耦合问题 3 IOC和DI的区别 AOP 1 什么是AOP 2 AOP在解决什么问题 3 为什么叫切面编程内容就不展示了里面已
Python自动检查哪位学生未提交作业

最近期未需要对学生提交的作业进行统计给平时成绩总共交了8次作业每个作业都有2个班数量太多于是就利用Python写了一个程序来自动实现思想获取指定路径下的所有文件名如果文件名中包含了学生的名字因为提交作业的时候以学号名字进
Flutter Windows应用开发环境配置

为什么要入Flutter开发的坑首先在当今Windows开发已经逐渐成为一个偏小众的领域不仅要涉及的知识面广还对开发人员的要求不低界面的精美也成为一个重要因素目前已知的Windows 客户端主要分成以下几种开发语言 Qt C C
Android登录之 Twitter登录

作为Android登录之 GooglePlay登录的姊妹篇这俩篇主要是对接国外平台登录的文章作者文笔并不好但是管他呢实现功能不就得了嘛 Twitter官网兄弟们自带梯子啊然后按照流程创建申请什么的也就不多说了接下来就是
Google C++风格指南阅读笔记

这个Google C 风格指南出得太好了有很多C 的问题其实通过阅读这份文档就可以了相信读完后可以在简历上加上一句具有良好的编码风格哈哈下面记录一下我的读书笔记吧整份文档的中文版本我已经上传到了资源里面 1 头文件 1 1头
在vue使用jsx来解决template中复杂的逻辑处理

1 首先安装依赖 npm install postcss loader autoprefixer babel loader babel core 2 在 babelrc文件中修改把 presets env stage 2 plugins
【Python】Windows如何在cmd中切换python版本

相信很多小伙伴都会有像我一样经历在windows中装了很多python版本那么如果我们正式使用的时候应该如何切换呢方法一从环境变量中切换python 第一步打开环境变量第二步打开系统变量中Path变量第三步将你想使用的Py
spring 多个切面的执行顺序及原理

最近和同事聊起来了springAOP的话题说了到多个切面的时候程序是怎么执行的我们常用的spring事务本身也是一个切面使用的AOP原理本人从网上找了一些资料然后根据这些资料进行一下总结资料地址 1 https blog csd
CodeLlama本地部署的实战方案

大家好我是herosunly 985院校硕士毕业现担任算法研究员一职热衷于机器学习算法研究与应用曾获得阿里云天池比赛第一名 CCF比赛第二名科大讯飞比赛第三名拥有多项发明专利对机器学习和深度学习拥有自己独到的见解曾经辅导过若
C++:没有与参数列表匹配的构造函数

报错 E0289 没有与参数列表匹配的构造函数 sales data sales data 实例初始化一个实例对象类内定义的构造函数报错原因构造函数中第二个参数的类型为 unsigned 而引用只能是引用一个对象实例化对象时括号
神经网络（十四）Pytorch完整模型训练和调用GPU加速

一模型的训练 Step1 准备数据集 import torchvision train data torchvision dataset CIFAR10 data train True transform torchvision ToTe