RuntimeError: Cannot initialize CUDA without ATen_cuda library.

2023-05-16

RuntimeError: Cannot initialize CUDA without ATen_cuda library. PyTorch splits its backend into two shared libraries: a CPU library and a CUDA library; this error has occurred because you are trying to use some CUDA functionality, but the CUDA library has not been loaded by the dynamic linker for some reason.  The CUDA library MUST be loaded, EVEN IF you don't directly use any symbols from the CUDA library! One common culprit is a lack of -Wl,--no-as-needed in your link arguments; many dynamic linkers will delete dynamic library dependencies if you don't depend on any of their symbols.  You can check if this has occurred by using ldd on your binary to see if there is a dependency on *_cuda.so library.

没有ATen_cuda库不能初始化CUDA。PyTorch将后端分成两个共享库:一个CPU库和一个CUDA库;这个错误已经发生，因为你试图使用一些CUDA功能，但CUDA库没有加载的动态链接器出于某种原因。必须加载CUDA库，即使你没有直接使用任何来自CUDA库的符号!一个常见的罪魁祸首是链接参数中缺少-Wl，—no-as-needed;许多动态链接器会删除动态库依赖，如果你不依赖他们的符号。你可以通过在你的二进制文件上使用ldd来检查是否有对*_cuda的依赖。所以图书馆。

在这里插入图片描述
Cannot initialize CUDA without ATen_cuda library… because you are trying to use some CUDA functionality

解决办法：https://github.com/zdevito/ATen/issues/216

即：加入LD_LIBRARY_PATH路径。具体见https://blog.csdn.net/m0_37644085/article/details/81837410的g)~h)

：https://blog.csdn.net/m0_37644085/article/details/81837410#t9

：https://github.com/zdevito/ATen/issues/216

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RuntimeError: Cannot initialize CUDA without ATen_cuda library. 的相关文章

CUDA - 为什么基于扭曲的并行减少速度较慢？

我有关于基于扭曲的并行减少的想法因为根据定义扭曲的所有线程都是同步的因此我们的想法是输入数据可以减少 64 倍每个线程减少两个元素而无需任何同步与 Mark Harris 的原始实现相同减少应用于块级数据位于共享内存上 h
优化三角矩阵计算的 CUDA 内核的执行

我正在开发我的第一个 Cuda 应用程序并且我的内核吞吐量低于预期这似乎是目前最大的瓶颈内核的任务是计算一个 N N 大小的矩阵 DD 包含数据矩阵上所有元素之间的平方距离数据矩阵 Y 的大小为 N D 以支持多维数据并存储为行
如何在 gitlab-ci docker 执行器中使用 cuda

我们正在使用 gitlab 持续集成来构建和测试我们的项目最近其中一个项目添加了 CUDA 的要求以启用 GPU 加速我不想改变我们的管道 docker 和 gitlab ci 对我们来说运行良好所以我想以某种方式让 docker
是否可以在设备函数中调用cufft库调用？

我在主机代码中使用 cuFFT 库调用它们工作正常但我想从内核调用 cuFFT 库早期版本的 CUDA 没有这种支持但是有了动态并行性这可能吗如果有任何关于如何实现这一目标的示例那就太好了尽管在 Kepler cc 3 5
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
CUDA：如何在设备上填充动态大小的向量并将其内容返回到另一个设备函数？

我想知道哪种技术可以填充设备上的动态大小数组 int row 在下面的代码中然后返回其内容以供另一个设备函数使用为了将问题置于上下文中下面的代码尝试使用在 GPU 上运行的高斯勒让德求积来跨越勒让德多项式基组中的任意函数 incl
Cuda Bayer/CFA 去马赛克示例

我编写了一个 CUDA4 Bayer 去马赛克例程但它比在 16 核 GTS250 上运行的单线程 CPU 代码慢块大小是 16 16 图像暗淡是 16 的倍数但更改此值并不会改善它我做了什么明显愚蠢的事情吗 calling rou
使用 QuasirandomGenerator （对于傻瓜来说）

我是 CUDA 的新手我正在努力在内核中生成随机数我知道有不同的实现而且在 SDK 4 1 中有一个 Niederreiter 拟随机序列生成器的示例我不知道从哪里开始我有点悲伤感觉自己像个傻瓜有人可以制作一个使用 Nied
寻找 CUDA 中的最大值

我正在尝试在 CUDA 中编写代码来查找最大值对于给定的一组数字假设您有 20 个数字并且内核在 2 个块每块 5 个线程上运行现在假设 10 个线程同时比较前 10 个值并且thread 2找到最大值因此线程 2 正在更新
为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？

我正在尝试将 CUDA 添加到 90 年代末编写的现有单线程 C 程序中为此我需要混合两种语言 C 和 C nvcc 是 c 编译器问题在于 C 编译器将结构视为特定大小而 C 编译器将相同的结构视为略有不同的大小那很糟我对此感
无法反序列化为对象：类型，KeyError: ' key: int;值：str'

我正在编写一个 python 脚本以使用 azure devops rest api 的 python 客户端库在 azure devops 中创建用户我正在使用添加用户权利的函数会员权利管理客户端链接到该客户端的代码 https
Application.Ontime 取消无法调用对象“Application”的“ONTIME”方法

I am 完全地失去了所以任何帮助将不胜感激我试图取消打开工作簿时触发的 2 个计划事件并使用 Application Ontime 方法重复我知道要终止 OnTime 计划循环您必须提供计划运行的确切时间并且拥有多个 Appli
调试时会忽略依赖项 commons-logging:commons-logging:1.2，因为它可能与 Android 提供的内部版本冲突

我收到以下警告警告依赖 commons logging commons logging 1 2 被忽略调试因为它可能与提供的内部版本冲突安卓如果出现问题请用jarjar重新打包更改类包依赖项 commons logging
无法在当前状态下启动设备：正在创建

我在 iOS 8 模拟器的 Xcode 6 中运行应用程序时遇到错误该错误指出无法在当前状态下启动设备正在创建我尝试重置模拟器的内容另外我在安装 Xcode 6 后重新启动了 mac 可能需要修复什么当我将 Xcode 应用程
MPI+CUDA 与纯 MPI 相比有何优势？

加速应用程序的常用方法是使用 MPI 或更高级别的库例如在幕后使用 MPI 的 PETSc 并行化应用程序然而现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃更大的问题感兴
如何在 Visual Studio 2010 中设置 CUDA 编译器标志？

经过坚持不懈的得到error identifier atomicAdd is undefined 我找到了编译的解决方案 arch sm 20旗帜但是如何在 VS 2010 中传递这个编译器标志呢我已经尝试过如下Project gt P
运行时 API 应用程序中的 cuda 上下文创建和资源关联

我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联我知道这是由驱动程序 API 在幕后完成的但我想了解一下创作的时间线首先我知道 cudaRegisterFatBinary 是第一个 cuda a
CUDA 估计 2D 网格数据的每块线程数和块数

首先我要说的是我已经仔细阅读了所有类似的问题确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
Nvcc 的版本与 CUDA 不同

我安装了 cuda 7 但是当我点击 nvcc version 时它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
C++ 中最难发现的错误[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

随机推荐

转知乎，感觉非常棒，适合普通人c++学习路线图

作者 xff1a 刘凯新链接 xff1a https www zhihu com question 23447320 answer 39322848 来源 xff1a 知乎著作权归作者所有商业转载请联系作者获得授权 xff0c 非商业
InfluxDB和IotDB介绍与性能对比

InfluxDB简介 InfluxDB 是用Go语言编写的一个开源分布式时序事件和指标数据库 xff0c 无需外部依赖用于存储和分析时间序列数据的开源数据库适合存储设备性能日志物联网传感器等带时间戳的数据其设计目标是实现分布式和
CVSNT SERVER Configuration

title CVSNT SERVER Configuration 64 author H819 64 version 0 5 Copyright free reference note author name and the article
JavaScript高级使用（对象、BOM、封装）

JavaScript高级今天给大家介绍以下几个内容 xff1a JavaScript 面向对象JavaScript 内置对象JavaScript BOMJavaScript 封装 JavaScript面向对象其实JavaScript中的
Python函数（函数定义、函数调用）用法详解

Python 中 xff0c 函数的应用非常广泛 xff0c 前面章节中我们已经接触过多个函数 xff0c 比如 input print range len 函数等等 xff0c 这些都是 Python 的内置函数 xff0c 可以直接使用
zsh配置

原本用WindTerm 43 bash xff0c WindTerm提供了高亮自动记忆补全等功能 xff0c 基本上也够用 WindTerm还是比较早期阶段 xff0c 功能细节上还有待完善 xff0c 稳定性方面也有些小问题比如用vi
Android CHRE (Context Hub Runtime Environment)简介

当前的ARM处理的多个核心 xff0c Android系统运行在速度最快的大核上 xff0c 通常叫AP xff08 Application Processor xff09 AP主要为性能体验优化 xff0c 相对来说能耗高处理器中还有
Docker pull 命令

Docker pull 命令 Docker 命令大全 docker pull 从镜像仓库中拉取或者更新指定镜像语法 docker pull OPTIONS NAME TAG 64 DIGEST OPTIONS说明 xff1a a 拉取所有
strrchr函数的实现

lt span style 61 34 font size 18px 34 gt include lt stdio h gt include lt string h gt char strrchr char const s1 int ch
UCOSIII概述

又给自己挖了一个小坑 xff0c 今天开始学习UCOS xff0c 本篇文章只是作为学习笔记 xff0c 并不是什么教程文章目录序言源码概览配置文件UCOSIII与移植相关代码文件UCOS与CPU相关代码文件UCOSIII库文件UCOS
UCOSIII中的消息传递

文章目录序言什么是消息队列消息队列相关函数OSQCreate OSQPend OSQPost 消息队列实验总结序言前面我们介绍了信号量 xff0c 通过信号量我们能够解决优先级反转 xff0c 资源共享冲突等问题 xff0c 但是我们
Qt之可视化QSS生成器（初探）

简述 QSS是Qt的样式表 xff0c 类似于CSS xff0c 目前主要支持CSS2 写代码调样式非常不直观 xff0c 因此需要一个所见即所得的可视化样式生成器 xff0c 网上有很多CSS样式生成器 xff0c 最适合网页开发人员的1
【秒懂音视频开发】26_RTMP服务器搭建

流媒体基本概念流媒体 xff08 Streaming media xff09 xff0c 也叫做 xff1a 流式媒体是指将一连串的多媒体数据压缩后 xff0c 经过互联网分段发送数据 xff0c 在互联网上即时传输影音以供观赏的一种
论文笔记之PPDM（Parallel Point Detection and Matching for Real-time Human-Object Interaction Detection）

分为两分支 xff0c 一个用于点 xff08 人物交互三个点 xff09 检测 xff0c 一个用于点匹配 xff0c 达到了实时的效果 CVPR2020接收论文地址 xff1a https arxiv org pdf 1912 1
FFmpeg入门 - rtmp推流

FFmpeg入门视频播放音视频开发老马的博客 CSDN博客介绍了怎样用ffmpeg去播放视频里面用于打开视频流的avformat open input函数除了打开本地视频之外实际上也能打开rtmp协议的远程视频实现拉流 demo
C/C++音视频高级开发 FFmpeg编程入门

1 播放器框架 1 1常用音视频术语容器 xff0f 文件 xff08 Conainer File xff09 xff1a 即特定格式的多媒体文件 xff0c 比如mp4 flv mkv等媒体流 xff08 Stream xff09 x
在vs code中调试编译有多个.c或.cpp文件的项目，报错undefined reference to “xxx“（cJSON小项目为例）

项目下载链接 xff1a https sourceforge net projects cjson 项目主要文件 xff1a cJSON c cJSON h test c 问题点 xff1a 有完整的头文件但编译时找不到 xff0c 一直报
LSTM网络中各层解读

构建深度神经网络最关键的部分之一是当数据流经不同的层时 xff0c 要对其有一个清晰的视图 xff0c 这些层经历了维度的变化形状的改变扁平化和重新塑造结构顺序每层解读 xff1a 把单词变为tokens xff1b embedd
Pytorch安装过程中遇到的失败

conda 进入虚拟环境 xff1a 1 conda 命令行安装 conda install pytorch torchvision cudatoolkit 61 10 2 c pytorch 但出现以下错误错误原因 xff1a 1 问题
RuntimeError: Cannot initialize CUDA without ATen_cuda library.

RuntimeError Cannot initialize CUDA without ATen cuda library PyTorch splits its backend into two shared libraries a CPU

RuntimeError: Cannot initialize CUDA without ATen_cuda library.

RuntimeError: Cannot initialize CUDA without ATen_cuda library. 的相关文章

随机推荐

热门标签