如何避免 PyTorch 中的“CUDA 内存不足”

2024-04-09

我认为对于 GPU 内存较低的 PyTorch 用户来说，这是一个非常常见的消息：

RuntimeError: CUDA out of memory. Tried to allocate X MiB (GPU X; X GiB total capacity; X GiB already allocated; X MiB free; X cached)

我尝试通过将每一层加载到 GPU 然后加载回来来处理图像：

for m in self.children():
    m.cuda()
    x = m(x)
    m.cpu()
    torch.cuda.empty_cache()

但似乎效果不是很大。我想知道是否有任何提示和技巧可以在使用少量 GPU 内存的情况下训练大型深度学习模型。

Although

import torch
torch.cuda.empty_cache()

为清除占用的cuda内存提供了一个很好的选择，我们还可以通过使用手动清除未使用的变量，

import gc
del variables
gc.collect()

但在使用这些命令后，错误可能会再次出现，因为 pytorch 实际上并没有清除内存，而是清除了对变量占用的内存的引用。因此，重新启动内核后减小batch_size并找到最佳batch_size是最好的选择（但有时不是一个非常可行的选择）。

深入了解 GPU 内存分配的另一种方法是使用：

torch.cuda.memory_summary(device=None, abbreviated=False)

其中，两个参数都是可选的。这提供了内存分配的可读摘要，并允许您找出 CUDA 内存不足的原因并重新启动内核以避免再次发生错误（就像我在我的例子中所做的那样）。

迭代传递数据可能会有所帮助，但改变网络层的大小或分解它们也被证明是有效的（因为有时模型也会占用大量内存，例如在进行迁移学习时）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

deeplearning

Pytorch

objectdetection

lowmemory

如何避免 PyTorch 中的“CUDA 内存不足” 的相关文章

Python：urlretrieve PDF下载

我在 Python 中使用 urllib 的 urlretrieve 函数来尝试从网站上获取一些 pdf 它至少对我来说已停止工作并正在下载损坏的数据 15 KB 而不是 164 KB 我已经用几个 pdf 对此进行了测试但都没有成功
有没有办法离线将多个 Plotly HTML 文件合并/嵌入到一个页面/HTML 文件中？

我正在尝试将多个图表合并成一个 HTML 报告来发送问题是我真的不认为子图是最好的主意因为图表相对不相关不同的 X Y 轴我所需要做的只是将图表附加到 1 个 HTML 文件中有一个指南解释了如何使用绘图 URL 来完成此操作但
python列表理解和extend() [重复]

这个问题在这里已经有答案了深入学习 Python 2 7 1 但未能理解这一点几个小时 gt gt gt a 1 2 gt gt gt b 3 4 gt gt gt gt gt gt a extend b 0 gt gt gt a 1
使用 Python 连接从 FTP 检索文件

我构建了这个简单的工具来暴力破解并连接到 ftp 服务器 import socket import ftplib from ftplib import FTP port 21 ip 192 168 1 108 file1 passwords
是否可以在 SQLAlchemy 中创建一个可以创建父记录的事件侦听器？

有两个表父表和子表我想创建一个事件监听器触发器如果孩子没有父母它可以创建父母这就是我试图做的 class parent db Model tablename parent id db Column db Integer prim
将 KB/MB/GB 等字符串解析为数值

为了不发明自行车我想知道是否有任何库能够将大小字符串 MB KB TB MiB KiB 等的各种表示形式解析为基于数字字节的值 ActiveState Receipes 有一个示例here http code activestate c
在 python 中返回 self [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表对象的类我有很多方法可以修改这个对象状态没有明显的返回或显然没有任何返回在 C 中我会将所有这些方法声明为void
PyKCS11 不可哈希列表

我的 python 脚本旨在获取特定 so 库中插槽令牌的详细信息输出如下所示 Library manufacturerID Safenet Inc Available Slots 4 Slot no 0 slotDescription
为什么通过selenium切换到alert不稳定？

为什么通过selenium切换到alert不稳定例如 1 运行代码一切顺利一切都很顺利但如果这段代码在几分钟内运行那么可能会出现错误例如没有可以单击的元素等等 2 在一个站点上有一个警报窗口 alert driver swi
scipy 的 curve_fit 函数的尺寸问题

我对 python 中的曲线拟合以及一般的 python 都很陌生目前我正在尝试使用 scipy 中的 curve fit 模块来拟合 4 个光谱峰简而言之我的文本文件中有两列数据所以我的第一步是将数据导入到两个数组中一个包含
如何在 PyCharm 中启用 flake8 的自动代码格式化

我使用 Tox 运行单元测试并使用 flake8 命令检查代码格式错误每次我在 PyCharm 中编码时我都会运行 tox 然后意识到我有一堆烦人的格式错误我必须返回并手动修复我希望 PyCharm 自动格式化代码根据 flak
在 Django 1.9 中使用信号

在 Django 1 8 中我能够使用信号执行以下操作一切顺利 init py from signals import 信号 py receiver pre save sender Comment def process hashtag
有没有办法在Python中调用子类定义的方法？

The init 方法定义了创建类的实例时要执行的操作创建子类时我可以做类似的事情吗假设我有抽象类Entity class Entity def onsubclasscreation cls for var in cls annotat
有没有更快的方法将数字转换为名称？

以下代码定义了映射到数字的名称序列它的设计目的是获取一个号码并检索一个特定的名称该类通过确保名称存在于其缓存中来进行操作然后通过索引到其缓存中来返回名称问题在这如何在不存储缓存的情况下根据数字计算出名称该名称可以被认为是一个以
让垂直网格线出现在 matplotlib 的线图中

我想在绘图上同时获得水平和垂直网格线但默认情况下仅显示水平网格线我正在使用一个pandas DataFrame从 python 中的 sql 查询生成 x 轴上带有日期的线图我不知道为什么它们没有出现在日期上我试图寻找这个问题的答案
如何在Python中检查元组是否包含元素？

我试图找到可用的方法但找不到没有contains 我应该使用index 我只想知道该项目是否存在不需要它的索引 You use in if element in thetuple whatever you want to do
launchd执行python脚本，但导入失败

我使用 appscript 编写了一个 python 脚本来跟踪我当前活动的窗口我通过 launchd 运行它但是当我这样做时它无法导入 appscript 我已经在 launchd 的 plist 中设置了 PYTHONPATH 但
交响二阶颂歌

我有一个简单的二阶 ODE 的齐次解当我尝试使用 Sympy 求解初始值时它返回相同的解它应该替代 y 0 和 y 0 并产生一个没有常数的解但事实并非如此这是建立方程的代码它是一个弹簧平衡方程 k 弹簧常数 m 质量我在其他
在大型文本文件中查找重复记录

我在一台 Linux 机器 Redhat 上并且有一个 11GB 的文本文件文本文件中的每一行包含单个记录的数据并且该行的前 n 个字符包含该记录的唯一标识符该文件包含略多于 2700 万条记录我需要验证文件中不存在具有相同唯一标
预提交钩子 git 错误

我正在尝试在 python 中执行预提交 git hook 以检查文件的行长度是否小于 80 个字符但是我收到没有此类文件目录的错误我在 fedora 上并设置了 usr bin python help 将不胜感激 usr bin e

随机推荐

Microsoft SQL 中的 MySQL 长文本类似物？

我是 Microsoft SQL 新手我正在尝试从 MySQL 导入数据库我遇到的唯一问题是 MySQL 数据库使用longtext多个表列的数据类型 Microsoft SQL 的哪些数据类型与 MySQL 类似longtext 感谢
使用 Titanium Framework 开发针对 iPhone 和 Android 的应用程序的最佳实践是什么？

我计划使用 Titanium Framework 为 iPhone 和 Android 开发一个应用程序有人可以根据您使用该框架的经验列出开发的最佳实践该做和不该做的事情吗首先有关于 Titanium 最佳实践的 Appcelera
增加堆大小后无法启动 Glassfish

我想增加 Glassfish 的堆大小为此我知道我可以达到 4GB java Xmx4000M version java version 1 6 0 26 Java TM SE Runtime Environment build 1 6
是否有一个标志可以检查我的代码以查看 PyCharm 的调试器是否正在运行？

我想在我的代码中执行一些操作条件是 PyCharm 调试器是否已连接并正在运行例如我已使用 IDE 的调试命令启动了我的代码就像是 if pycharm debugger is running do something else
当源代码管理资源管理器显示变更集的分支和合并时，这意味着什么？

我试图了解驻留在 TFS 2005 中的代码库的历史记录并且遇到了一个变更集其中所有更改都被标记为分支和合并 Name Change Folder A cs merge branch Root Solution Project 我无法找
Gnuplot 5：曲线之间的颜色渐变阴影

这是用 Matplotlib 创建的是否可以在 Gnuplot 5 中制作相同类型的阴影我不知道 gnuplot 有渐变填充选项但我可能是错的以下是一个有点丑陋的解决方法您基本上创建了 3 个相互重叠的图您可能需要调整调色板
为什么无法读取收据数据以进行设备上验证

我正在使用以下代码来读取收据数据我可以使用 OpenSSL 静态库 1 1 1k 成功验证收据签名 private func readReceipt receiptPKCS7 UnsafeMutablePointer
git commit 命令无限期挂起

当我尝试使用进行提交时git commit Sublime Text 编辑器确实打开了我编写了提交消息并保存并关闭了编辑器但更改并未提交终端挂在git commit 我在网上搜索发现有人有同样的问题并且不假思索地应用了相同的修复程
如何在WPF中为数据触发提供多个条件？

如何在WPF中为数据触发提供多个条件 Use 多数据触发 http msdn microsoft com en us library system windows multidatatrigger aspx type
Wix如何隐藏功能选项

我正在使用 Wix 3 5 构建 MSI 安装程序我想知道是否有任何方法可以隐藏功能自定义安装对话框中的某些选项您可以在其中从功能树中选择要安装的内容我只想有将安装在本地硬盘上和整个功能将不可用的选项目前除了这两个选项
java DOM xml 文件创建 - 输出文件中没有制表符或空格

我已经浏览了 stackoverflow 上的帖子但似乎没有任何帮助这是有的 write the content into xml file TransformerFactory transformerFactory Transform
取消分配准备好的查询

编辑我感谢丹尼尔和丹尼斯问题现在已经解决了正如他们巧妙地指出的那样这种情况下的问题是程序员特别是没有彻底思考我希望我能接受这两个答案注意说我是 postgresql 新手是在侮辱新手我正在编写一个 Web 应用程序它将利
在iPhone编程中从服务器下载mp3文件[重复]

这个问题在这里已经有答案了可能的重复从服务器下载音乐文件并保存在我的应用程序中 https stackoverflow com questions 5620849 download music file from server and
如何在颤振中使用精度对整数进行舍入

我试图使折线图的 Y 轴间隔在颤动中动态化这里MaxVal将获取Y轴的最大值 int interval maxVal 6 toInt int length interval toString length toInt 所以在这里我将 ma
如何组合 List> 中的所有谓词

我有一个问题我相信你能帮助我解决我的皱纹 I have List
如何在 C# WinForms 中的 Label 上编写二次方程？

我们正在制作统计软件我们需要在任何地方放置公式例如ax2 bx c怎么做ax2表示x平方2 我想在x的上侧显示2 与 c 相同我想在后缀处显示 c 您是否有用户可以选择但无法编辑的固定公式列表然后为每个公式生成一个图像将它们存储在
将向量列表添加到 R 中的 data.frame

如何将向量列表添加到预先分配的 data frame 中以便向量形成 data frame 的行 eg ll lt list c 1 2 3 c 2 3 4 dd lt data frame matrix nrow 10 ncol 3 我
无法使用 NGINX Plus 替换 NGINX 作为使用 Kubernetes 的 Google Cloud 上微服务的反向代理

我正在关注this https cloudplatform googleblog com 2016 06 creating a scalable API with microservices html关于如何使用 Kubernetes 在
使用树输出预测 Spark 中梯度提升树情况下的类概率

众所周知 Spark 中的 GBT 目前可以为您提供预测标签我正在考虑尝试计算一个类的预测概率假设所有实例都落在某个叶子下构建 GBT 的代码 import org apache spark SparkContext import o
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac

如何避免 PyTorch 中的“CUDA 内存不足”

如何避免 PyTorch 中的“CUDA 内存不足” 的相关文章

随机推荐

热门标签