Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃

2023-11-22

在网上搜索了几个小时没有结果，所以我想在这里问一下。

我正在尝试按照 Sentdex 的教程制作一辆自动驾驶汽车，但是在运行模型时，我遇到了一堆致命错误。我在网上搜索了解决方案，很多人似乎都有同样的问题。但是，我没有找到任何解决方案（包括这个堆栈帖子），为我工作。

这是我的软件：

Tensorflow：1.5，GPU版本
CUDA：9.0，带补丁
CUDnn: 7
Windows 10 专业版
Python 3.6

硬件：

Nvidia 1070ti，带有最新驱动程序
英特尔 i5 7600K

这是崩溃日志：

2018-02-04 16:29:33.606903: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\stream_executor\cuda\cuda_blas.cc:444] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 2018-02-04 16:29:33.608872: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\stream_executor\cuda\cuda_blas.cc:444] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 2018-02-04 16:29:33.609308: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\stream_executor\cuda\cuda_blas.cc:444] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 2018-02-04 16:29:35.145249: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED 2018-02-04 16:29:35.145563: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM 2018-02-04 16:29:35.149896: F C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\core\kernels\conv_ops.cc:717] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms)

这是我的代码：

 import tensorflow as tf
    import numpy as np
    import cv2
    import time
    from PIL import ImageGrab
    from getkeys import key_check
    from alexnet import alexnet
    import os
    from sendKeys import PressKey, ReleaseKey, W,A,S,D,Sp

    import random

    WIDTH = 80
    HEIGHT = 60
    LR = 1e-3
    EPOCHS = 10
    MODEL_NAME = 'DiRT-AI-Driver-{}-{}-{}-epochs.model'.format(LR, 'alexnetv2', EPOCHS)

    def straight():
        PressKey(W)
        ReleaseKey(A)
        ReleaseKey(S)
        ReleaseKey(D)
        ReleaseKey(Sp)
    def left():
        PressKey(A)
        ReleaseKey(W)
        ReleaseKey(S)
        ReleaseKey(D)
        ReleaseKey(Sp)
    def right():
        PressKey(D)
        ReleaseKey(A)
        ReleaseKey(S)
        ReleaseKey(W)
        ReleaseKey(Sp)
    def brake():
        PressKey(S)
        ReleaseKey(A)
        ReleaseKey(W)
        ReleaseKey(D)
        ReleaseKey(Sp)
    def handbrake():
        PressKey(Sp)
        ReleaseKey(A)
        ReleaseKey(S)
        ReleaseKey(D)
        ReleaseKey(W)

    model = alexnet(WIDTH, HEIGHT, LR)
    model.load(MODEL_NAME)


    def main():
        last_time = time.time()
        for i in list(range(4))[::-1]:
            print(i+1)
            time.sleep(1)


    paused = False
    while(True):
            if not paused:
                screen = np.array(ImageGrab.grab(bbox=(0,40,1024,768)))
                screen = cv2.cvtColor(screen,cv2.COLOR_BGR2GRAY)
                screen = cv2.resize(screen,(80,60))
                print('Loop took {} seconds'.format(time.time()-last_time))
                last_time = time.time()
                print('took time')
                prediction = model.predict([screen.reshape(WIDTH,HEIGHT,1)])[0]
                print('predicted')
                moves = list(np.around(prediction))
                print('got moves')
                print(moves,prediction)

                if moves == [1,0,0,0,0]:
                    straight()
                elif moves == [0,1,0,0,0]:
                    left()
                elif moves == [0,0,1,0,0]:
                    brake()
                elif moves == [0,0,0,1,0]:
                    right()
                elif moves == [0,0,0,0,1]:
                    handbrake()

            keys = key_check()

            if 'T' in keys:
                if paused:
                    pased = False
                    time.sleep(1)
                else:
                    paused = True
                    ReleaseKey(W)
                    ReleaseKey(A)
                    ReleaseKey(S)
                    ReleaseKey(D)
                    ReleaseKey(Sp)
                    time.sleep(1)


main()

我发现导致 python 崩溃并产生前三个错误的行是这一行：

prediction = model.predict([screen.reshape(WIDTH,HEIGHT,1)])[0]

运行代码时，CPU 利用率高达 100%，这表明出现了严重问题。 GPU 达到约 40-50%

我尝试过 Tensorflow 1.2 和 1.3，以及 CUDA 8，但效果不佳。安装 CUDA 时，我不安装特定的驱动程序，因为它们对于我的 GPU 来说太旧了。也尝试了不同的 CUDnn，但效果不佳。

就我而言，问题的发生是因为另一个 python 控制台tensorflow导入正在运行。关闭它解决了问题。

我有 Windows 10，主要错误是：

未能创建 cublas 句柄：CUBLAS_STATUS_ALLOC_FAILED

无法创建 cudnn 句柄：CUDNN_STATUS_ALLOC_FAILED

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃的相关文章

Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
如何在 kubernetes 上使多个 pod 相互通信

我是 Kubernetes 新手我正在尝试通过 microk8s 将应用程序部署到 Kubernetes 该应用程序包含Python Flask后端 Angular前端 Redis和MySQL数据库我将映像部署在多个 Pod 中状态显
混合 SOM（带 MLP）

有人可以提供一些有关如何正确地将自组织映射与多层感知器结合起来的信息吗我最近读了一些关于这种技术的文章与常规 MLP 相比它在预测任务中表现得更好因此我想使用 SOM 作为前端通过对输入数据进行聚类来降维并将结果传递到 MLP
为什么我们应该在 Keras 中对深度学习数据进行标准化？

我正在 Keras 中测试一些网络架构以对 MNIST 数据集进行分类我已经实现了一个类似于 LeNet 的方法我看到在网上找到的例子中有一个数据标准化的步骤例如 X train 255 我在没有这种标准化的情况下进行了测试我发
Python Pandas 从宽到长的格式更改以及列标题拆分

我有一个包含以下列标题和行示例的表 Subject Test1 Result1 Test1 Result2 Test2 Result1 Test2 Result2 0 John 10 0 5 20 0 3 我想将其改造成 Subject l
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
修复类以在 Flask 会话中启用对象存储[重复]

这个问题在这里已经有答案了我有一个自定义类 Passport 其中包含活动用户身份和权限我曾经将它存储在会话中如下所示 p Passport p do something fancy session passport p 它就奏效了
Highcharts 奇怪的分组行为

我正在使用延迟加载 http www highcharts com stock demo lazy loading加载 OHLC 数据的方法在服务器端我使用 Python MySQL 并有 4 个包含 OHLC 数据的表时间间隔为 5
将分布拟合到直方图

I want to know the distribution of my data points so first I plotted the histogram of my data My histogram looks like th
如何将一串Python代码编译成一个可以调用函数的模块？

在 Python 中我有一串 Python 源代码其中包含以下函数 mySrc def foo print foo def bar print bar 我想将这个字符串编译成某种形式类似模块的对象这样我就可以调用代码中包含的函数这是我
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
Python：使用for循环更改变量后缀

我知道这个问题被问了很多但到目前为止我无法使用理解答案我想改变for循环中变量的后缀我尝试了 stackoverflow 搜索提供的所有答案但很难理解提问者经常提出的具体代码因此为了清楚起见我使用一个简单的示例这并不意味着
使用 plone.api 创建文件的 Python 脚本在设置文件时出现错误 WrongType

Dears 我正在创建一个脚本python来在Plone站点中批量上传文件安装是UnifiedInstaller Plone 4 3 10 该脚本读取了一个txt 并且该txt以分号分隔在新创建的项目中设置文件时出现错误下面是脚本 f
无法在 Windows 服务器上使 SVN 预提交脚本失败

我正在编写一个 SVN pre commit bat 文件该文件调用 Python 脚本来查询我们的问题跟踪系统以确定用户提供的问题跟踪 ID 是否处于正确的状态例如打开状态并与正确的关联项目 SVN 服务器运行 Windows
Java 相当于 Python 的 urllib.urlencode（基于 HashMap 的 UrlEncode）

From https stackoverflow com questions 2018026 should i use urllib or urllib2 2018103 2018103 Java 中 Python 的 urllib url
在Python中打开网站框架或图像

所以我对 python 相当熟练并且经常使用 urllib2 和 Cookies 来实现网站自动化我刚刚偶然发现了 webbrowser 模块它可以在默认浏览器中打开一个网址我想知道是否可以从该 url 中仅选择一个对象并打开它具
如何有效地计算另一列中每个元素的较大元素的数量？

我有以下内容df name created utc 0 t1 cqug90j 1430438400 1 t1 cqug90k 1430438400 2 t1 cqug90z 1430438400 3 t1 cqug91c 143043840
Python模糊字符串匹配作为相关样式表/矩阵

我有一个文件其中包含 x 个字符串名称及其关联的 ID 本质上是两列数据我想要的是一个格式为 x by x 的相关样式表将相关数据作为 x 轴和 y 轴但我想要 fuzzywuzzy 库的函数 fuzz ratio x y 作为输出
将字典写入 csv 时遇到问题，其中键作为标题，值作为列

我有一本字典看起来像 mydict foo 1 2 bar 3 4 asdf 5 6 我正在尝试将其写入 CSV 文件使其看起来像 foo bar asdf 1 3 5 2 4 6 我花了最后一个小时寻找解决方案我发现的最接近的解决方
将自定义属性添加到 Tk 小部件

我的主要目标是向小部件添加隐藏标签或字符串之类的内容以在其上保存简短信息我想到创建一个新的自定义 Button 类在本例中我需要按钮它继承所有旧选项这是代码 form tkinter import class NButton Bu

随机推荐

在 matplotlib 颜色条中对齐刻度标签

我有一个带有正值和负值的颜色条这些值是自动生成的我没有设置它们不幸的是减号破坏了文本的垂直对齐方式如何将刻度标签中的所有文本向右对齐或者在正数之前插入一个空格以使其看起来不错您可以更改文本的对齐方式可能需要稍微更改标签的 x
为什么 Traversable 不能多次访问其元素？

我记得在某处读过像这样的类型不可能Traversable data Bar a Bar a deriving Show instance Functor Bar where fmap f Bar x Bar f x instance Fo
如何获取数组项的类型？

如果我有一个类型type foo Array lt name string test number gt 是否可以获取数组中值的类型在本例中为接口我知道有keyof要获取密钥是否有类似的值如果您正在寻找如何提取 name strin
地图视图平滑缩放

当我使用 MapController setZoom x 时例如从级别 5 缩放到 15 时缩放执行得非常快并且通常不会加载新级别的地图图块这对用户来说看起来不太好任何地图内置功能都可以将其更改为更慢的缩放以便在达到 15 级
Android：编辑文本中密码的最小长度

在android中有没有简单的方法可以在edittext中设置最小密码长度在 xml 中只有最大长度选项而没有最小长度选项设置 em 和宽度等选项来限制长度但是什么时候设置最小长度呢我在文档中找到了这个 DevicePolicy
浮点型与双精度型

是否存在比较 equals 两个浮点值之间将返回false如果你将它们比较DOUBLE但返回true如果你将它们与 FLOAT 进行比较作为我的小组项目的一部分我正在编写一些程序来比较任何给定类型的两个数值我总共需要处理四种类型 do
Java 中的 double 到 long 无需转换

我需要将 double 转换为 long 保留其二进制结构而不是数值只需更改类型但保留二进制值不变有没有一种本地方法可以做到这一点有Double与 doubleToLongBits 和 doubleToLongRawBits Ja
如何在 Hibernate 中使用唯一键而不是主键检索记录

Using session load or session get 或任何其他方法org hibernate session 是否可以在hibernate中根据Unique列而不是PK列值获取记录我的要求是我需要根据唯一列值而不是主键获取
将 Arc 克隆为 Arc，其中 T 实现 U

我觉得很奇怪 use std sync Arc trait Fruit struct Pear impl Fruit for Pear fn main let pear Arc new Pear let cloned Arc clone p
在 Neo4j 中实现 Dijkstra 算法

我对 Neo4j 很陌生有人可以向我解释请逐步如何实现 Dijkstra 算法来找到两个节点之间的最短路径是否可以简单地使用 Cypher 来完成它我已经尝试过最短路径算法但它很慢 MATCH from Location Loc
为什么我不能反转 str::split 的结果？

根据文档Split 有一个rev方法对结果的影响split在字符串上 fn main let mut length 0 let mut mult 1 for part in 1 30 split rev length mult part p
Eclipse p2：category.xml 和 site.xml 之间的区别

p2 存储库创建 ant 任务例如 eclipse publish featuresAndBundles 似乎采用指定类别信息的 site xml 或category xml 文件我发现 eclipse 生成的 site xml 和ca
圆形ViewPager。第一轮后碎片无法正常工作

好的所以我需要圆形 ViewPager 我真的很难实施它现在我已经实现了它并且就圆形滚动而言它运行良好但我注意到一个问题那就是第一轮滚动片段不起作用后我有三个片段里面有一个按钮按钮在第一轮有效但当我回到第一页时按钮不起作
有没有办法在 Eclipse 中自动生成 getter 和 setter？

我正在研究一个新的Android项目 Java 并创建了一个带有大量变量的对象由于我计划为所有这些添加 getter 和 setter 所以我想知道是否有捷径Eclipse自动生成给定类中的 getter 和 setter 在所需类的源
使用 JSONB 列内的值连接表

有两个表授权联系人 auth contacts userid varchar contacts jsonb contacts包含具有属性的联系人数组 contact id type discussion contact id varcha
在 cmake 构建中使用 LLVM

我正在尝试构建自己的使用 LLVM 的项目我在官网上下载了源码和预编译包最新版本 http releases llvm org download html 我下载了 LLVM source code Clang for Windows
角度材料将 angularjs 1.5 组件加载到 $mdDialog 中

目标使用组件而不是使用 scope 来设置数据没有可共享的错误问题是对话框加载组件时未设置数据元素屏幕截图显示了对话框的当前状态选项卡 2 信息中应该有一个绑定的对象我可以使用 onComplete 事件验证对话框加载后对象
如何通过两个键对 JSON 对象进行排序？

我有一个 JSON 对象我想先按一个键排序然后按第二个键排序类似于 SQL 中按两列排序以下是我想要的 JSON 示例 GROUPID 3169675 LASTNAME Chantry 我想按 GROUPID 然后按 LASTNAM
每个连接请求都被视为直接连接请求+ android ble

我们正在编写一个 ble 应用程序希望与我们想要连接的外设建立持久连接出于同样的目的每当我们失去现有连接时我们都希望与外围设备重新连接因此我们作为中心的 Android 应用程序只是尝试通过调用 bluetoothdevice
Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃

在网上搜索了几个小时没有结果所以我想在这里问一下我正在尝试按照 Sentdex 的教程制作一辆自动驾驶汽车但是在运行模型时我遇到了一堆致命错误我在网上搜索了解决方案很多人似乎都有同样的问题但是我没有找到任何解决方案包括这个

Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃

Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃 的相关文章

随机推荐

热门标签

Tensorflow 因 CUDNN_STATUS_ALLOC_FAILED 崩溃的相关文章