尝试运行 TensorFlow 时 CUDNN_STATUS_NOT_INITIALIZED

2024-02-09

我已经在带有 Cuda 9.0 和 CuDNN 7.0.5 以及普通 Python 2.7 的 Ubuntu 16.04 上安装了 TensorFlow 1.7，尽管它们的 CUDA 和 CuDNN 示例都运行良好，并且 TensorFlow 可以看到 GPU（因此可以运行一些 TensorFlow 示例），但那些使用 CuDNN 的示例（就像大多数 CNN 例子一样）没有。他们失败并显示以下信息消息：

2018-04-10 16:14:17.013026: I tensorflow/stream_executor/plugin_registry.cc:243] Selecting default DNN plugin, cuDNN
25428 2018-04-10 16:14:17.013100: E tensorflow/stream_executor/cuda/cuda_dnn.cc:403] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
25429 2018-04-10 16:14:17.013119: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:369] driver version file contents: """NVRM version: NVIDIA UNIX x86_64 Kernel Module  384.130  Wed Mar 21 03:37:26 PDT 2018
25430 GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.9)
25431 """
25432 2018-04-10 16:14:17.013131: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:112] version string "384.130" made value 384.130.0
25433 2018-04-10 16:14:17.013135: E tensorflow/stream_executor/cuda/cuda_dnn.cc:411] possibly insufficient driver version: 384.130.0
25434 2018-04-10 16:14:17.013139: E tensorflow/stream_executor/cuda/cuda_dnn.cc:370] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
25435 2018-04-10 16:14:17.013143: F tensorflow/core/kernels/conv_ops.cc:712] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms)

打开大量 VLOG 消息（请参阅下面的链接了解如何执行此操作）不会产生任何其他相关消息。

这里的关键信息might be“选择默认的 DNN 插件 cuDNN”，因为查看代码我可能认为它无法加载 cuDNN 库模块，但据我所知这实际上是正常的（所以不是警告），问题可能是其他原因。

例如，“CUDNN_STATUS_NOT_INITIALIZED”消息似乎是在早期版本中由 TF 提前过度分配内存引起的（在 TF GitHub 问题列表中找到了这一点），因此 CuDNN 无法初始化，但我尝试了这些补救措施（包括重置GPU 和重新启动），但它们没有帮助。

关于我下一步应该尝试什么有什么想法吗？

好吧，我发现了这一点，这是因为我安装了错误版本的 cuDNN，所以我怀疑它实际上没有找到正确的共享库，这是真的。

基本上我安装了cuDNN v7.1.2 for Cuda 9.1代替cuDNN v7.1.2 for Cuda 9.0，这似乎导致它默默地失败 - 尽管我预计此时会出现错误消息。请注意，我正在运行详细的 VLOG（请参阅我在这篇文章中的回答，了解有关如何执行此操作的更多信息）打开 TF 日志 https://stackoverflow.com/questions/44853059/tensorflow-logging-messages-do-not-appear/49756653#49756653):

当我安装时cuDNN v7.1.2 for Cuda 9.0事实上，它确实找到了它，并抱怨该版本不够新 - 事实上，真正的问题是它不够旧，但至少我有一些真实的数据可以使用。

到底cuDNN v7.0.5 for Cuda 9.0是我所需要的并且有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

尝试运行 TensorFlow 时 CUDNN_STATUS_NOT_INITIALIZED 的相关文章

pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
为什么 __instancecheck__ 没有被调用？

我有以下 python3 代码 class BaseTypeClass type def new cls name bases namespace kwd result type new cls name bases namespace p
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似
使用 SERVER_NAME 时出现 Flask 404

在我的 Flask 配置中我将 SERVER NAME 设置为 app example com 之类的域我这样做是因为我需要使用url for with external网址如果未设置 SERVER NAME Flask 会认为服务器

随机推荐

Sqlite C++ 中的预准备语句如何工作

我不知道如何在我的 Sqlite3 代码中实现准备好的语句 include
C# pinvoke 封送联合

我在将 C Union 转换为 C 时遇到一些问题这是联盟的定义 union Info char varChar 8 short varShort 4 int varInteger 2 float varFloat 2 double va
无法在 Kivy 中查看 tiff 图像

problem 我可以使用以下命令加载图片Image kivy 中的模块但由于某种原因我无法将 tif 文件加载到 kivy 中当图像源为 pics lugia png 图像加载得很好但如果来源是 pics snorlax tif
java 字段变化监听器

所以我真的想要某种方法来检测某个对象的场变化我用谷歌搜索了很长一段时间但没有找到任何东西所以基本上我需要知道的是对象的某些变量何时发生变化让我们以这个类为例 public class Example String text test
GWT 开发者模式代码服务器

GWT 开发人员模式嵌入式 http 服务器对我来说很有意义但我承认我不明白代码服务器是什么让我印象深刻的是一个 html 文件包含了浏览器在开发过程中使用处理 AJAX 的嵌入式 Jetty 服务器呈现 GWT 应用程序所需的所
在 AngularJS 中使用 ng-repeat 过滤结果 6 到 10（共 100 个）

我看到limitTo文档中的过滤器这允许我限制前 5 个或后 5 个结果但我想设置限制的开始位置以便我可以显示第二组 5 个结果有内置过滤器吗从 Angular 1 4 0 开始 limitTo filter https docs
如何修改子字符串？

使用排序规则xxx german2 ci它治疗 and ue相同是否有可能出现所有M nchen突出显示如下输入示例 M nchen can also be written as Muenchen 输出示例 b M nchen b ca
Git - 递归删除文件扩展名

我试图递归地删除文件扩展名但无论我尝试什么它都会失败谢谢你的任何想法 ubuntu ubuntu laptop hh hh sdk src uboot hh git rm r cached o fatal pathspec src u
DirectShow 与 Media Foundation 进行视频捕捉？

我正在尝试在视频捕获监控流媒体应用程序的这两个 API 之间进行选择但我不确定哪个是最佳选择一些背景知识我需要它与各种视频采集卡适配器一起使用该应用程序可能会用 C 开发因此本机 API 至关重要性能很重要因为我需要处理
如何检查密码重置令牌是否已过期？

我正在使用 ASP NET Identity 并且具有基本的忘记密码重置密码功能当您填写忘记密码的表单时它会使用以下命令创建一个重置令牌 userManager GeneratePasswordResetTokenAsync user
为什么 CoreBluetooth 一次又一次地发现相同的外设？

我已经在 StackOverflow 上查看了类似的问题但它们都处理由于收到扫描响应数据而对 CBManager 委托的 didDiscover 方法进行第二次调用我的情况有所不同我坐在家里的办公桌前我的应用程序在 iPhone 6
使用 matplotlib 对带有标签的点进行动画处理

我有一个带有线条的动画现在我想标记这些点我试过plt annotate 我尝试过plt text 但标签不动这是我的示例代码 import numpy as np import matplotlib pyplot as plt imp
如何设置ScrollView内容的大小？

现在 ScrollView ContentSize 属性是只读的我该如何设置 ScrollView 内容的大小在 UIScrollView 中可设置的属性完全相同但不是 xamarin 形式我有这个
JSON.stringify(response.json()) 和 response.text() 之间的区别

将响应流转换为 JSON 后两者是否完全相同 const responseA fetch endpointReturnsJson const textA await responseA text 在平行宇宙里 const response
我们可以在 SVG 模板中渲染 Angular 组件吗？

看到我们可以将模板文件另存为 svg而不是 html现在我想我可以制作 svg 组件可以按如下方式使用 main component svg
Rails + Compass：与直接使用 haml + blueprint 相比的优势

我有一些在 Rails 项目上使用 haml sass 的经验我最近开始将它们与 blueprintcss 一起使用我所做的唯一一件事是将 blueprint css 转换为 sass 文件并从那里开始编码我什至有一个轨道发电机 h
事后实现接口

我认为以下内容无法在 Java 中完成但我很乐意学习如何实现类似的东西假设我们有一个类 C 它已在编译代码中使用我们既不能更改该代码也不能更改 C 的原始定义进一步假设有一些有趣的代码可以重用只要 C 实现接口 I 即可事实
如何获取 Android 设备内部下载文件夹路径？ [复制]

这个问题在这里已经有答案了是否可以获取Android设备内部下载文件夹路径如果设备有 SD 卡您可以使用 Environment getExternalStorageState 如果您没有 SD 卡您可以使用 Environment
PInvoke 返回带有二维数组的结构

我有定义在的结构c questions tagged c 2b 2bWin32 DLL 如下所示 typedef struct matrix double data int m int n Matrix 并且有一个函数 Matrix get
尝试运行 TensorFlow 时 CUDNN_STATUS_NOT_INITIALIZED

我已经在带有 Cuda 9 0 和 CuDNN 7 0 5 以及普通 Python 2 7 的 Ubuntu 16 04 上安装了 TensorFlow 1 7 尽管它们的 CUDA 和 CuDNN 示例都运行良好并且 TensorFlo

尝试运行 TensorFlow 时 CUDNN_STATUS_NOT_INITIALIZED

尝试运行 TensorFlow 时 CUDNN_STATUS_NOT_INITIALIZED 的相关文章

随机推荐

热门标签