关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法

2023-05-16

在paddlepaddle的export.py导出的模型（也就是生成__model__,params,deploy.yaml三个文件），
运行时报错Out of memory error on GPU 0. Cannot allocate 32.959229MB memory on GPU 0, available memory is only 3.287499MB.

其实显卡时内存足够的。

解决办法：

在程序运行的前面添加如下代码

os.environ[‘FLAGS_eager_delete_tensor_gb’] = “0.0”

主要作用是 GPU memory garbage collection optimization flags

另外网上的其他办法做一个总结

1 如果是在多卡的环境下运行的出现错误
可以设置
CUDA_VISIBLE_DEVICES=“0” #后面是显卡编号，确保程序在这张显卡上运行

2 如果是在自己写的代码下运行报错
一定要开启model.eval()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

paddlepaddle

CUDA

Error

out

memory

关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法的相关文章

Android - WindowManager 导致崩溃并显示“窗口数超过最大 300”

我看到我的日志软件中报告了此错误但无法确定导致该错误的原因或者 300 限制指的是什么视图数或列表中可能显示的项目数这就是我可以从日志中获取的全部内容 window count is over max 300 android vie
应用程序无缘无故地被杀死。怀疑 BSS 高。如何调试呢？

我已经在CentOs6 6中成功运行我的应用程序最近硬件主板和内存更新了我的应用程序现在毫无理由地被杀死 root localhost PktBlaster PktBlaster Killed 文件和 ldd 输出 root lo
JVisualVM/JConsole 中的 System.gc() 与 GC 按钮

我目前正在测试处理 XML 模式的概念验证原型并围绕一个非常消耗内存的树自动机外部库我已经获得了源代码构建我想绘制真实峰值堆随着模式大小的增加不同运行的内存消耗使用的指标符合我的目的并且不会影响问题或者至少是它的合理近似
最小化 MC 模拟期间存储的 cuRAND 状态数量

我目前正在 CUDA 中编写蒙特卡罗模拟因此我需要生成lots使用随机数cuRAND图书馆每个线程处理一个巨大的元素floatarray 示例中省略并在每次内核调用时生成 1 或 2 个随机数通常的方法参见下面的示例似乎是为每
NUMA 在虚拟内存中是如何表示的？

有许多资源 https en wikipedia org wiki Non uniform memory access从硬件角度描述NUMA的架构性能影响 http practical tech com infrastructure num
具有 Cuda Thrust 的多个 GPU？

如何将 Thrust 与多个 GPU 一起使用这只是使用 cudaSetDevice deviceId 的问题吗然后运行相关的 Thrust 代码使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
如何在WinMobile6上启用ARMv6非对齐访问？

ARMv6 引入了一个很棒的功能未对齐的内存访问这使得代码中的某些事情变得更加简单和更快但微软只在winCE6中提供了API 现在大多数 PDA 都基于 WinMobile6 基于 CE 5 x 默认情况下禁用未对齐访问我尝试在 C
大型跨平台软件项目的技巧/资源

我将开始一个大型软件项目涉及跨平台 GUI 和大量的数字运算我计划用 C 和 CUDA 编写大部分应用程序后端并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统这将是一个只有两名开发人员的项目一旦我相对深入地了解它
防止控制台应用程序中的内存工作集最小化？

我想防止控制台应用程序中的内存工作集最小化在Windows应用程序中我可以这样做覆盖 SC MINIMIZE 消息 http support microsoft com kb 293215 en us fr 1 但是如何在控制台应用程
字符串与 char[]

我有一些来自 IBM 的幻灯片名为从 Java 代码到 Java 堆了解应用程序的内存使用情况 http www ibm com developerworks library j codetoheap N101DC 也就是说当我们使
如何计算汇编中的内存位移？

我一直在研究 yasm 汇编语言并生成了一个包含以下内容的列表文件我需要帮助理解第一列中的内存位移是如何计算的提前致谢 1 line 1 1 memory asm 2 section data 3 00000000 04000000
估计 libGD 操作所需的内存

在尝试使用 libGD 在 PHP 中调整图像大小之前我想检查是否有足够的内存可用于执行该操作因为内存不足会完全终止 PHP 进程并且无法捕获我的想法是原始图像和新图像中的每个像素 RGBA 需要 4 字节内存 check av
了解 Linux oom-killer 日志

我的应用程序被 oom killer 杀死了它是在实时 USB 上运行的 Ubuntu 11 10 无需交换 PC 具有 1 Gig 的 RAM 唯一运行的应用程序除了所有内置的 Ubuntu 东西是我的程序 flasherav 请注
清除堆内存以防止内存不足异常

我知道已经有人问过有关内存不足的问题但我没有找到解决方案在位图工厂中我出现内存不足异常甚至使用 inSampleSize 1 所以我经常用 try catch 内存不足异常来包围它因为这是一个不好的做法 try catch Out
Java堆和栈内存分配

class Person private String name public Person public Person String name this name name public static void main String a
云或烟雾的粒子系统

我正在尝试使用 OpenGL 和 CUDA 制作一个简单的用于云和烟雾模拟的粒子系统如何使粒子系统中的粒子表现得像真正的云或烟雾在低湍流风中的表现我现在遇到的一些问题是颗粒聚集成一个大球粒子扩散到无限远粒子突然弹射离开我已经完成
用eclipse测试java程序的内存消耗[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Java中如何高效存储小字节数组？

By small字节数组我指的是长度从 10 到 30 的字节数组 By store我的意思是存储它们在内存中不序列化并持久化到文件系统系统 macOS 10 12 6 Oracle jdk1 8 0 141 64 位 JVM 参数
32位进程在64位操作系统上可以访问多少内存？

在 Windows 上正常情况下 32 位进程只能访问 2GB RAM 或通过 boot ini 文件中的特殊开关访问 3GB 在 64 位操作系统上运行 32 位进程时有多少可用内存是否有任何特殊的开关或设置可以改变这种情况默认
C++ 并行任务的开销

我有以下简单的功能 include

随机推荐

Vscode配置树莓派ROS的开发环境

树莓派安装ROS系统和远程连接配置我的这篇博客附上连接 xff1a https blog csdn net weixin 44815966 article details 112697896 开发ros机器人时 xff0c 为了方便开发和
ROS操作系统 opencv-python读取摄像头+rviz可视化

ROS操作系统 opencv python读取摄像头 43 rviz可视化一安装opencv python二 opencv读取摄像头三图片转换为ROS图片格式并且在rviz显示测试环境 xff1a 树莓派ubuntu 18 04 5
Git 报错：Connection closed by remote host. fatal: Could not read from remote repository.

Git deploy 部署报错 xff1a ssh exchange identification Connection closed by remote host fatal Could not read from remote repo
RabbitMQ详解（二）：Docker安装RabbitMQ

一安装并运行二其他操作在Docker上安装部署RabbitMQ方便快捷 xff0c 不需要额外安装Erlang环境 xff0c 所以写该篇文章先来介绍如何在Docker上部署RabbitMQ 一安装并运行 1 在docker hub
android 注解和反射 (入门以及使用)

先来看一看今天的效果代码效果效果不重要重要的是代码注解官方解释从JDK5开始 Java增加对元数据的支持 xff0c 也就是注解 xff0c 注解与注释是有一定区别的 xff0c 可以把注解理解为代码里的特殊标记 xff0c 这
Linux ubuntu安装LLVM12+Clang

安装之前确保安装cmake3 20以上版本参考https blog csdn net weixin 42888638 article details 125617062 从官网下载安装包 llvm project 12 0 0 src t
总线？什么是总线？

近期有些小朋友问我 xff1a Jing哥啊 xff0c 计算机好多基础我都不懂 xff0c 看编程视频讲到的时候 xff0c 什么数据总线 xff0c 地址总线我都不懂其实阿Jing以前也有这个困扰 xff0c 一直困扰 xff0c
FreeRTOS学习任务调度

任务调度任务调度实现在多个任务之间轮流使用CPU xff0c 他的主要工作分为三个阶段 xff1a 保存当前任务上下文到任务栈选择新任务恢复新任务的上下文这三个步骤需要在中断服务函数中执行 xff0c 所以要求执行的速度要快 xff0c
FreeRTOS学习信号量

信号量 FreeRTOS 学习仓库 xff1a https gitee com killerp free rtos study 在深入理解了消息队列后 xff0c 信号量也就很容易学习了因为信号量就是使用消息队列实现的信号量是特殊的消息
Java-CSS基础选择器

标签选择器 HTML标签作为标签选择器的名称 p为标签选择器 p 属性 font size 20px 声明值类选择器 lt 标签名 class 61 34 类名称 34 gt 标签内容 lt 标签名 gt class为类名称 xff1b
Java-CSS层次选择器

层次选择器后代选择器选择器 xff1a E F xff08 两个选择器之间必须要以空格隔开 xff09 功能 xff1a 选择匹配的F元素 xff0c 且匹配的F元素被包含在匹配的E元素内 lt p gt 1 lt p gt lt p
arm-linux-gcc踩坑1

嵌入式实验要用到交叉编译arm linux gcc xff0c 其中遇到一些问题 xff0c 记录如下 1 安装交叉编译器并更新环境 xff1a export PATH 61 PATH usr local arm 4 6 2 bin gcc
python实现基本算法之归并排序(Merge sort)

基本算法之归并排序 Merge sort 基本算法 04 归并排序 Merge sort 算法往期请看选择排序 xff0c 插入排序 xff0c 归并排序 xff0c 快速排序等等都发布的 xff01 欢迎大家批评指正 xff01 文章目
Linux学习笔记——第一章 Linux是什么如何学习

前言鸟叔的Linux私房菜第四版学习笔记 1 Linux是什么 1 1 Linux是什么 Linux是一套操作系统 xff0c 就像Windows一样操作系统会有效率的控制计算机硬件的资源分配 xff0c 并提供计算机运作所需要的功能
MaxWell的使用

Maxwell的使用 1 Maxwell的概述 1 1 官网简介 This is Maxwell s daemon an application that reads MySQL binlogs and writes row updates
对图像维度进行调整（升降维和调整顺序）

图片路径 xff1a img path span class token operator 61 span span class token punctuation span span class token operator span d
题目 3：逆函数随机采样

题目 3 xff1a 随机采样小透明任务定义已知 LaplaceX 随机变量X xff0c 它的均值为 0 xff0c 方差为 1 通过一个均匀分布的随机抽样 xff0c 实现对x p x 的抽样 xff0c 并得到对应的 100 个
VMware虚拟机如何为GPU直通启用

查阅了很多资料是目前的我的电脑显卡不支持 xff0c 基本上N卡的好多常用卡都不支持具体可以查看以下内容 https www dell com support article zh hk sln288103 E5 A6 82 E4 BD
PX4 docker gazebo 安装踩坑记

本来想在Linux上自己一步步搭建 px4的仿真gazebo程序的 xff0c 查了资料发现docker已经打包好了 xff0c 就直接找到这个目录 xff0c 跟着一步一步的安装 PX4 docker 但是在安装的过程中 xff0c 有一
关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法

在paddlepaddle的export py导出的模型 xff08 也就是生成 model params deploy yaml三个文件 xff09 xff0c 运行时报错Out of memory error on GPU 0 Cann

关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法

关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法 的相关文章

随机推荐

热门标签

关于paddlepaddle使用推理模式时CUDA error:out of memory错误的解决办法的相关文章