CUDA 错误：调用 cublasCreate(handle) 时出现 CUBLAS_STATUS_ALLOC_FAILED

2024-01-07

当我在 Google Colab 中运行 PyTorch 深度学习模型时，出现以下错误

/usr/local/lib/python3.6/dist-packages/torch/nn/functional.py in linear(input, weight, bias)
   1370         ret = torch.addmm(bias, input, weight.t())
   1371     else:
-> 1372         output = input.matmul(weight.t())
   1373         if bias is not None:
   1374             output += bias

RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`

我什至将批量大小从 128 减少到 64，即减少到一半，但仍然出现此错误。早些时候，我以批量大小 128 运行相同的代码，但没有收到任何这样的错误。

不，在这种情况下，批量大小并不重要。

最可能的原因是标签数量和输出单元数量不一致。

尝试在正向传递中打印最终输出的大小并检查输出的大小

print(model.fc1(x).size())
Here fc1返回之前将被替换为模型最后一个线性层的名称

确保label.size()等于prediction.size()在计算损失之前

即使解决了这个问题之后，你也必须重新启动 GPU 运行时（我在使用 Colab GPU 时需要这样做）

此 GitHub 问题评论 https://github.com/pytorchbearer/torchbearer/issues/658#issuecomment-581407150可能也会有帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

NLP

CUDA

bertlanguagemodel

CUDA 错误：调用 cublasCreate(handle) 时出现 CUBLAS_STATUS_ALLOC_FAILED 的相关文章

Lighttpd 和 cgi python

我正在尝试通过 lighttpd 执行一些 python 脚本但是当我尝试运行它时我只得到一个要求我下载的空白文件 lighttpd conf server modules mod access mod alias mod access
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
需要在python中找到print或printf的源代码[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在做一些我不能完全谈论的事情我
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
使用字典映射数据帧索引

为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

当激活默认拒绝时，Spring Security ROLE_ANONYMOUS 不起作用

我启用了安全性的默认拒绝功能有了这个我想在某些控制器上提供匿名访问为此我启用了匿名身份验证如果我使用antmacher permitAll 工作正常但如果我正在使用 PreAuthorize value hasRole ROLE
如何在 CALayer 上获取触摸事件？

我是 iPhone SDK 的新手现在我正在使用我非常喜欢的 CALayers 进行编程不像 UIViews 那么昂贵并且比 OpenGL ES sprites 的代码少得多我有这个问题是否可以在 CALayer 上获取触摸事件
如何在VS 2010中禁用缩进虚线

在每个缩进上看到这些虚线我该如何关闭它我一定是不小心按下了某个键盘快捷键但我在设置中找不到它抱歉这是一个非常愚蠢的问题但这些话真的让我很困扰我不知道还能转向哪里通过以下方式打开关闭它编辑 gt 高级 gt 查看空白 Th
Ruby 中对数组中的集合进行平均的最佳方法是什么？

给定以下简单数据集对 0 25 53 和 80 组的值进行平均的最佳方法是什么 0 148 5 0 146 5 0 148 6 0 202 3 25 145 7 25 145 5 25 147 4 25 147 3 53 150 4 53
有哪些大型网站正在使用 Amazon EC2 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在寻找托管在 Amazon EC2 S3 Cloudfront 等上的大型网站的示例我在一家公司工作我们运行一个网站该网站每月在运行 10
Delphi中如何检测打印机型号？

当我插入 HP Laserjet 3015 时 Windows 会检测到正确的型号然后尝试安装适当的驱动程序如何检测所连接打印机的型号我不想使用已安装打印机的列表因为 Zebra 打印机可以使用通用纯文本驱动程序进行安装我是一名
OAuth (Instagram) 无需刷新

我有一个单页 JavaScript 应用程序我想知道是否可以在不刷新页面的情况下对 Instagram 上的用户进行身份验证我想尝试使用 javascript 执行类似于 Facebook 连接的操作其中 Facebook 对话框在弹
为什么编译器需要.java后缀而解释器不需要.class后缀？

编译 Foo java javac Foo java 运行程序 java Foo 为什么编译器需要 java后缀但解释器不需要 class suffix 正如其他几个答案所解释的那样 Java 编译器采用文件名作为参数而解释器采用类名所
Android 操作栏向上导航按钮在设备上不起作用

Action Bar up navigation button works fine in emulator but does not work in device can any one help me out 主要活动 Override
从android中的服务调用BroadCastReceiver来更新Fragment中的UI？

我想更新UI of a fragment from service 我在用GCM用于发送消息我有这个课程GCM public class GcmIntentService extends IntentService public GcmI
来自阻塞（具有重叠 I/O 属性）Winsock2 调用的意外 WSA_IO_PENDING

简洁版本使用阻塞套接字 API 调用时我收到 WSA IO PENDING 我该如何处理插座有重叠 I O 属性 https support microsoft com en gb help 181611 socket overlap
qtcreator 在“停止”时发送的信号

我正在 Linux 上工作当我使用 Qt 创建者 IDE 上的停止按钮关闭应用程序时我意识到我的应用程序留下了守护进程我想处理这些情况以便应用程序以与关闭主窗口相同的方式关闭要编写处理程序我需要知道它对应于哪些信号深入研究
使用 rowindex 从 JTable 检索行数据

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 如何从 a 中检索行数据JTable
Jetpack Compose 应用程序无法在 AVD 上启动

我已经使用编写了一个示例Jetpack Compose然后每当我尝试Install它在一个AVD gradle 构建Project成功但内置应用程序未启动关于工具和代码的一切都很好甚至Preview shows UI好吧如果我自己手
使用ajax保存wordpress设置api选项，

我已经和这个问题斗争了一段时间了我有一个主题的选项页面并注册了一个选项我一直试图在每次用户按下保存按钮时通过ajax更新选项这是我的代码 JS function save main options ajax main options
MySQL MATCH AGAINST 不起作用

我实际上正在开发一个网站其中有两个几乎相同的表其中 MATCH AGAINST 在一个表上有效但在另一个表上无效为了找出为什么我试图将其简化为一个简单的问题让我们制作一个简单的表格但事实并非如此我正在使用 phpMyAdmin
typeid(T) 是在运行时还是编译时评估？

我无法在任何地方找到这个看似简单的问题的答案以下 C 函数是否使用 RTTI 当然不必但我想知道是否可以保证 typeid 将在编译时确定 template
WaitAndRetryPolicy 与 BulkheadPolicy 结合，优先重试。是否可以？

我正在评估Polly https github com App vNext Polly 库的功能和灵活性方面作为评估过程的一部分我试图将WaitAndRetryPolicy与BulkheadPolicy政策以实现弹性和节流的结合问题
使用 Jackson 解析 Java 中的 JSON 子集

给定一个 Json 是否可以使用 Jackson 只解析出消息的一部分假设我感兴趣的数据埋藏在深层的字段层次结构中并且我根本不关心为每个类创建 DTO 类给定一个非常简单的场景我想对 Telephone 类进行建模而不了解其之前的
CUDA 错误：调用 cublasCreate(handle) 时出现 CUBLAS_STATUS_ALLOC_FAILED

当我在 Google Colab 中运行 PyTorch 深度学习模型时出现以下错误 usr local lib python3 6 dist packages torch nn functional py in linear input

CUDA 错误：调用 cublasCreate(handle) 时出现 CUBLAS_STATUS_ALLOC_FAILED

CUDA 错误：调用 cublasCreate(handle) 时出现 CUBLAS_STATUS_ALLOC_FAILED 的相关文章

随机推荐

热门标签