PyTorch学习（10）:训练技巧

2023-05-16

PyTorch学习（10）:训练技巧

Pytorch官方文档： https://pytorch-cn.readthedocs.io/zh/latest/
参考：
https://efficientdl.com/faster-deep-learning-in-pytorch-a-guide/
https://www.reddit.com/r/MachineLearning/comments/n9fti7/d_a_few_helpful_pytorch_tips _examples_included/
https://mp.weixin.qq.com/s/IFAYiGUMUU7oYW-vWs_u1Q
https://mp.weixin.qq.com/s/93f5w0X3ZoAuE5tosYPqIg

文章目录

PyTorch学习（10）:训练技巧
- 1.在DataLoader中使用多个worker和页锁定内存
- - 2.考虑使用另一种优化器
  - 3.使用. as_tensor() 而不是. tensor()
  - 4.在 BatchNorm 之前关闭 bias
  - 5. 在验证期间关闭梯度计算
  - 6.删除模型时，使用torch.cuda.empty_cache()清除GPU缓存
  - 7.预测之前一定记得调用model.eval()
总结

1.在DataLoader中使用多个worker和页锁定内存

当使用 torch.utils.data.DataLoader 时，设置 num_workers > 0，而不是默认值 0，同时设置 pin_memory=True，而不是默认值 False。

2.考虑使用另一种优化器

AdamW 是由 fast.ai 推广的一种具有权重衰减（而不是 L2 正则化）的 Adam，在 PyTorch 中以 torch.optim.AdamW 实现。AdamW 似乎在误差和训练时间上都一直优于 Adam。

3.使用. as_tensor() 而不是. tensor()

torch.tensor() 总是会复制数据。如果你要转换一个 numpy 数组，使用 torch.as_tensor() 或 torch.from_numpy() 来避免复制数据。

4.在 BatchNorm 之前关闭 bias

在开始 BatchNormalization 层之前关闭 bias 层。对于一个 2-D 卷积层，可以将 bias 关键字设置为 False：torch.nn.Conv2d(…, bias=False, …)。

5. 在验证期间关闭梯度计算

在验证期间关闭梯度计算，设置：torch.no_grad() 。

6.删除模型时，使用torch.cuda.empty_cache()清除GPU缓存

尤其是在使用笔记本删除并重新创建大型模型时。

7.预测之前一定记得调用model.eval()

如果你忘记调用model.eval()，也就是忘记将模型转变为evaluation（测试）模式，那么Dropout层和Batch Normalization层就会对你的预测数据造成干扰。

总结

综上，仅为PyTorch框架的常用训练技巧。
还有很多相关策略来提升模型训练和预测性能，可访问参考链接，进行详细查明；或者在实践中不断积累，不断百度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

训练技巧

PyTorch学习（10）:训练技巧的相关文章

在 Pytorch 中获取负片（倒置）图像

我想直接从数据加载器获取图像的负片并将其作为张量提供有我可以使用的库吗我试过火炬transforms并没有找到任何不要费力只需使用255 image它会给你一个负面的形象试试吧
PyTorch：tensor.cuda（）和tensor.to（torch.device（“cuda：0”））之间有什么区别？

在 PyTorch 中以下两种将张量或模型发送到 GPU 的方法有什么区别 Setup X np array 1 3 2 3 2 3 5 6 1 2 3 4 X model X torch DoubleTensor X Method
推导 pytorch 网络的结构

对于我的用例我需要能够采用 pytorch 模块并解释模块中的层序列以便我可以以某种文件格式在层之间创建连接现在假设我有一个简单的模块如下所示 class mymodel nn Module def init self input
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
RuntimeError：维度指定为 0 但张量没有维度

我试图使用 MNIST 数据集实现简单的 NN 但我不断收到此错误将 matplotlib pyplot 导入为 plt import torch from torchvision import models from torchvisi
查找张量中沿轴的非零元素的数量

我想找到沿特定轴的张量中非零元素的数量有没有 PyTorch 函数可以做到这一点我尝试使用非零 http pytorch org docs master torch html highlight nonzero torch nonzer
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l

随机推荐

[tensorflow] feed_dict 传入序列

当前 xff0c tensorflow xff08 1 0 xff09 还不是很人性化在session中传入序列参数到图模型中并不是很方便所以 xff0c 现在只能将序列中每一个元素对应的tensor和实际值对应写入dict进行传送比
tensorflow 中对数组元素的操作

上个月没咋写文章这个月开始 xff0c 多进行进行总结分享 tensorflow中对tensor对象进行像numpy数组一样便捷的操作是不可能的 xff0c 至少对1 2以及之前的版本而言从issue上看到 xff0c 有不少人希望te
Err:4 http://mirrors.sohu.com/ubuntu xenial-security InRelease

ubuntu 16 04版本出现安装或者更新软件时网址链接error的问题解决方法如下 xff1a step1 打开系统设置 xff0c 双击软件与更新 xff1b step2 修改Download from为Main Server 然后点
在Win10中安装虚拟机：VMware Workstation Player+Ubuntu20.04

引言本篇首先在Win10中安装虚拟机工具软件VMware Workstation Player xff1b 然后按照鸿蒙设备开发环境的要求 xff0c 用VMware Workstation Player创建一个虚拟机 xff1b 最后在
CAS5.2x单点登录(一)——搭建cas服务器

单点登录的介绍单点登录 xff08 Single Sign On 简称SSO xff09 是目前比较流行的服务于企业业务整合的解决方案之一 xff0c SSO 使得在多个应用系统中 xff0c 用户只需要登录一次就可以访问所有相互信任的应
CAS5.2x单点登录(二)cas服务器连接数据库

前面一节应该已经告诉大家如何搭建cas的服务器了 xff0c 可是搭建好能用吗 xff1f 我们现在的用户验证是在哪呢 xff1f 哪个默认的用户名和密码有是在哪呢 xff1f 本节就讲一下如何使用cas服务器连接我们自己的用户数据库 xf
word双栏排版，最后一页由于分节符造成最后一页是空白页，删除分节符双栏就变成了单栏

遇到这个问题时 xff0c 我们把心思都花在了如何删除这个空白页但是最有效的办法不是删除 xff0c 而是 xff08 以word2007为例 xff09 xff1a Word 2007中文版 xff1a 鼠标放在最后一页 xff0
oracle 10g和11g下 CDC机制（change data capture）变化数据捕捉

oracle 10g和11g下 CDC机制 xff08 change data capture xff09 变化数据捕捉用于同步数据如果是在同一数据库内 xff0c 同步数据 xff0c oracle好像建议 xff0c 不用这个 xf
VNC服务搭建

安装vncserver和GNOME yum install span class token operator span y tigervnc tigervnc span class token operator span server y
PyTorch学习（1）:基础知识

PyTorch学习 xff08 1 xff09 基础知识 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github
PyTorch学习（2）:数据加载机制

PyTorch学习 xff08 2 xff09 数据加载机制 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https githu
PyTorch学习（3）:数据预处理

PyTorch学习 xff08 3 xff09 数据预处理 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github
PyTorch学习（4）:模型

PyTorch学习 xff08 4 xff09 模型 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github co
PyTorch学习（5）:损失函数

PyTorch学习 xff08 5 xff09 损失函数 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github
PyTorch学习（6）:优化算法

PyTorch学习 xff08 6 xff09 优化算法 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github
PyTorch学习（7）:学习率

PyTorch学习 xff08 7 xff09 学习率 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github c
PyTorch学习（8）:模型保存和加载

PyTorch学习 xff08 8 xff09 模型保存和加载 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https gith
PyTorch学习（9）:实战

PyTorch学习 xff08 9 xff09 实战 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest Pytorch学习文档 xff1a https github co
oracle10g和11g版本自动undo管理模式下的手动问题

糟心事情终于过了 xff0c 写写看PDF心得参数 xff1a smu debug mode 来自 ITPUB博客 xff0c 链接 xff1a http blog itpub net 9606200 viewspace 2083963
PyTorch学习（10）:训练技巧

PyTorch学习 xff08 10 xff09 训练技巧 Pytorch官方文档 xff1a https pytorch cn readthedocs io zh latest 参考 xff1a https efficientdl com

热门标签