问题：Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

2023-05-16

I've seen this error message for three different reasons, with different solutions:

1. You have cache issues

I regularly work around this error by shutting down my python process, removing the ~/.nv directory (on linux, rm -rf ~/.nv), and restarting the Python process. I don't exactly know why this works. It's probably at least partly related to the second option:

2. You're out of memory

The error can also show up if you run out of graphics card RAM. With an nvidia GPU you can check graphics card memory usage with nvidia-smi. This will give you a readout of how much GPU RAM you have in use (something like 6025MiB / 6086MiB if you're almost at the limit) as well as a list of what processes are using GPU RAM.

If you've run out of RAM, you'll need to restart the process (which should free up the RAM) and then take a less memory-intensive approach. A few options are:

reducing your batch size
using a simpler model
using less data
limit TensorFlow GPU memory fraction: For example, the following will make sure TensorFlow uses <= 90% of your RAM:

import keras
import tensorflow as tf

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.9  # 0.6 sometimes works better for folks
keras.backend.tensorflow_backend.set_session(tf.Session(config=config))

This can slow down your model evaluation if not used together with the items above, presumably since the large data set will have to be swapped in and out to fit into the small amount of memory you've allocated.

A second option is to have TensorFlow start out using only a minimum amount of memory and then allocate more as needed (documented here):

os.environ['TF_FORCE_GPU_ALLOW_GROWTH'] = 'true'

3. You have incompatible versions of CUDA, TensorFlow, NVIDIA drivers, etc.

If you've never had similar models working, you're not running out of VRAM and your cache is clean, I'd go back and set up CUDA + TensorFlow using the best available installation guide - I have had the most success with following the instructions at https://www.tensorflow.org/install/gpu rather than those on the NVIDIA / CUDA site. Lambda Stack is also a good way to go.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Failed

GET

Convolution

Algorithm

This

问题：Failed to get convolution algorithm. This is probably because cuDNN failed to initialize 的相关文章

如何求小于给定数的最大2次方

我需要找到小于给定数字的最大 2 次幂我陷入困境找不到任何解决方案 Code public class MathPow public int largestPowerOf2 int n int res 2 while res lt n
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
由周期表元素形成的最大单词的算法

我想为以下问题场景编写一个算法根据元素周期表元素的名称找到可以组成的最大单词符号如Na Ne等应被视为单个元素这是在一家知名公司的求职面试中被问到的有人可以帮我解决这个问题吗我认为更好的方法是检查字典中的每个单词看看是否可以从
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
无需构建树即可预测霍夫曼压缩比

我有一个二进制文件我知道其中每个符号出现的次数如果我要使用霍夫曼算法压缩它我需要预测压缩文件的长度我只对假设的输出长度感兴趣而不对单个符号的代码感兴趣因此构建霍夫曼树似乎是多余的作为一个例子我需要得到类似的东西包含 4 个
关于在字典中查找所有有效单词的算法问题

给定一个字典只是一个字符串列表您收到来自外部来源的未知数量的信件给定字母串您将如何列出您可以通过这些字母的任意组合组成的所有有效单词来自字典因此如果您收到 applead 你应该找到apple bad pad lead等我知
分而治之策略来确定列表中是否有超过 1/3 的相同元素

我正在使用分治算法来确定列表中是否有超过 1 3 的元素相同例如 1 2 3 4 不所有元素都是唯一的 1 1 2 4 5 是的其中 2 个是相同的没有排序是否有分而治之的策略我陷入了如何划分的困境 def is valid i
C 埃及分数

古埃及人仅使用以下形式的分数1 n因此任何其他分数都必须表示为这些单位分数的总和而且所有单位分数都是不同的在C或Java中使任何分数成为埃及分数总和越少越好的好方法是什么可以使用什么算法分支定界 a 例如 3 4 1 2 1
生成所有多集大小为 n 的分区的算法

我一直在试图找出一种方法来生成多重集的所有不同的大小为 n 的分区但到目前为止却空手而归首先让我展示一下我想要实现的目标假设我们有一个输入向量uint32 t std vector
在常数空间中创建 1..N 的随机排列

我正在寻找枚举固定空间中数字 1 N 的随机排列这意味着我无法将所有数字存储在列表中原因是 N 可能非常大超过可用内存我仍然希望能够一次遍历这样一个数字的排列只访问每个数字一次我知道对于某些 N 可以这样做许多随机数生成器随机
阻止通过 GET 传递“提交”按钮值？

我正在尝试通过 GET 传递表单信息这很重要这样人们就可以将表单选择中过滤后的数据发送给其他人问题是使用下面的代码它不仅传递过滤器信息还传递提交表单值如下所示 index php month filter Feb year f
具有多个谓词的 C++11 算法

功能如std find if来自algorithmheader 确实很有用但对我来说一个严重的限制是我只能为每次调用使用 1 个谓词count if 例如给定一个像这样的容器std vector我想同时应用相同的迭代find if 多个
shell脚本中关联数组的时间复杂度

我想知道在 shell 脚本中使用关联数组时如何构造实现另外我想知道基于 shell 脚本的关联数组的时间复杂度是否是最佳的因为我们可以使用字母和数字作为它们各自的键编辑他们使用什么哈希函数如果您使用关联数组则不能通过使用
迭代任意大小的子集

我可以迭代大小为 1 的子集 for int a 0 a lt size a 或大小为 2 的子集 for int a1 0 a1 lt size a1 for int a2 a1 1 a2 lt size a2 or 3 for int
从一种数字系统转换为另一种数字系统后会有多少位数字

主要问题有多少位数字让我解释我有一个二进制数 11000000 十进制数是192 转换为十进制后它有多少位以十进制表示在我的示例中它是 3 位数字但是这不是问题我在互联网上搜索并找到了一种用于整数部分的算法和一种用于小数
大数据使用什么数据结构

我有一个包含一百万行的 Excel 工作表每行有 100 列每行代表一个具有 100 个属性的类的实例列值是这些属性的值哪种数据结构最适合在这里使用来存储数百万个数据实例 Thanks 这实际上取决于您需要如何访问这些数据以及您想要
归并排序中的递归：两次递归调用

private void mergesort int low int high line 1 if low lt high line 2 int middle low high 2 line 3 mergesort low middle l
如何通过 Ruby 中的代理获取带有用户代理和超时的 URL？

如果我需要通过某些方式获取 URL 我该如何获取 URLproxy 它必须有一个timeout最大 n 秒和一个用户代理 require nokogiri require net http require rexml document d
从 1 到 20 亿，像 (23,29) 这样相差 6 的连续素数对的数量

如何在考虑时间复杂度的情况下从 1 到 20 亿使用任何编程语言且不使用任何外部库找到像 23 29 这样相差 6 的连续素数对的数量尝试过埃拉托色尼筛但获得连续素数是一个挑战使用了生成器但时间复杂度非常高代码是 def ge
如何使用 python 有效地找到两个大文件的交集？

我有两个大文件它们的内容如下所示 134430513125296589151963957125296589 该文件包含未排序的 id 列表某些 id 可能会在单个文件中出现多次现在我想找到路口两个文件的一部分这就是两个文件中都出现的

随机推荐

GDAL driver查找

矢量driver https gdal org drivers vector index html 栅格driver https gdal org drivers raster index html 以矢量driver为例 xff0c 代码
windows用xrdp方式远程桌面连接ubuntu

一安装桌面环境 Ubuntu 服务器通常使用命令行进行管理 xff0c 并且默认没有安装桌面环境如果你正在运行 Ubuntu 桌面版 xff0c 忽略这一步在 Ubuntu 源仓库有很多桌面环境供你选择一个选择是安装 Gnome x
设置xrdp使用固定的会话

修改xrdp ini配置文件 xff0c 位于 etc xrdp xrdp ini 要打开和编辑xrdp的配置文件 xff0c 请使用 xff1a sudo nano etc xrdp xrdp ini 默认情况下 xff0c 第一个xrd
土地覆盖/土地利用简介及数据集

1 简介土地覆盖 xff1a 地球表面当前所具有的自然和人为影响所形成的覆盖物 xff0c 是地球表面的自然状态 xff0c 如森林草场农田土壤冰川湖泊沼泽湿地及道路等土地利用 xff1a 是人类在生产活动中为达到一定的经济
华为云OBS数据桶使用

华为云OBS数据桶的使用模式和AWS类似 xff0c 可以参考这个链接入门总览对象存储服务 OBS 快速入门华为云 huaweicloud com 概览 OBS最基础的入门操作包括创建桶上传对象和下载对象 xff0c 通过这三个操作
Landsat Fractional Snow Covered Area Product（Landsat雪比例产品，含云掩膜）

Landsat Fractional Snow Covered Area Product 是一套30米的雪比例产品 xff08 含云掩膜 xff09 该产品包括2部分一是雪比例产品fSCA xff0c 产品文件说明 LXSS US HHH
keras加载模型错误：“bad marshal data“

问题 xff1a 使用python 3 8环境下的keras加载python 3 6环境保存的模型文件时 xff0c 出现错误 ValueError bad marshal data unknown type code 原因 xff1a m
用脚本批量执行redis命令

最近在维护一个用redis做缓存的项目时 xff0c 遇到了产品需要不定时清除用户数据的需要 xff0c 由于每次要清除的用户数据很多 xff0c 每次手动删除的话比较繁琐 xff0c 最后采用了批处理脚本的方式来执行清除的命令首先将要执
解决AttributeError: module ‘keras.utils.generic_utils‘ has no attribute ‘populate_dict_with_module**

问题 xff1a 使用keras 2 2 4和tensorflow2 5组合时 xff0c import keras出现错误 AttributeError module 39 keras utils generic utils 39 has
windows系统下conda正常安装gdal后import gdal导入出错:ImportError: DLL load failed

问题 xff1a Window10系统 xff0c 使用conda安装gdal后在cmd中可以import gdal xff0c 但在pycharm使用该虚拟环境时 xff0c import gdal则报错 ImportError DLL
Error running docker container: starting container process caused “exec: \“python\“: executable file

问题 xff1a miniconda3虚拟环境创建python环境 xff0c 使用下面Dockerfile编译docker镜像 FROM cuda10 2 pt1 5 09061 COPY workspace WORKDIR worksp
pytorch历史版本安装

1 whl下载安装 pytorch 离线 whl包官方下载地址 xff1a https download pytorch org whl torch stable html 从里面找就行了 xff0c 一般比直接pip网上下载对应的资源快得
allow_growth控制tensorflow显存动态增长无效问题

问题 xff1a tensorflow1 15环境使用config gpu options allow growth 61 True xff0c 控制显存动态增长 xff0c 发现无效 xff0c 显存仍然会被完全占用 config 61
标准规范查询与下载

1 标准规范查询国标行标地方规范等可以在全国标准信息公共服务平台查询 xff0c 例如国标在 xff1a 国家标准目录查询全国标准信息公共服务平台 samr gov cn 2 标准规范下载如果标准规范右侧显示全文链接 xff0c
视频ts格式转mp4

工具下载 xff1a TS转MP4 zip 使用方法 xff1a 1 xff0c 把压缩包解压到TS文件的目录里 2 xff0c 双击run bat 3 xff0c 等待运行完成 xff0c 出来同名的MP4文件 4 xff0c 删除TS文
Ubuntu安装特定版本python和pip

安装python 更新apt get xff08 推荐 xff01 xff01 xff01 xff09 apt get update 安装python3 6 apt get install python3 6 安装后默认不识别python命
apt-get清理安装包

rm rf var lib apt lists
Dockerfile最小化构建镜像：减少层数、清理无用数据、多段构建

docker的官方虽然有数十万计的免费镜像 xff0c 但是出于某些安全考虑 xff0c 一般不会使用免费镜像 xff0c 因此这就需要我们自己制作镜像 xff0c 制作的镜像如果很大 xff0c 那么在镜像上传下载的时候是很不方便的 x
Gson 用户指南(中文)

整体概括 Gson 是一个将Java对象转换成Json字符串 xff0c 将Json字符串转换陈成Java对象的工具库 Gson能够处理任何类型的Java对象 xff0c 甚至包括那些你没有源代码的Java类不了解对象的属性 Gson能干
问题：Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

I 39 ve seen this error message for three different reasons with different solutions 1 You have cache issues I regularly

热门标签