fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决

2023-05-16

最近一个同学加载一个新的预训练模型时候碰到了这样一个问题，帮他排查解决一下：

File "/data/anaconda3/envs/nlp/lib/python3.6/site-packages/torch/utils/cpp_extension.py", line 1362, in _jit_compile return _import_module_from_library(name, build_directory, is_python_module)

File "/data/anaconda3/envs/nlp/lib/python3.6/site-packages/torch/utils/cpp_extension.py", line 1752, in _import_module_from_library module = importlib.util.module_from_spec(spec)

File "<frozen importlib._bootstrap>", line 541, in module_from_spec File "<frozen importlib._bootstrap_external>", line 912, in create_module File "<frozen importlib._bootstrap>", line 229, in _call_with_frames_removed

ImportError: /data/.cache/torch_extensions/py36_cu111/fused_adam/fused_adam.so: cannot open shared object file: No such file or directory

Google搜了一下也没搜到什么相关的内容，分析有大概几种可能：

1. 看到No such file or directory分析可能是路径设置问题写成绝对路径可能会解决

2. 也可能是checkpoint文件本身的问题是否加载的文件有损坏？

3. 环境配置是否有问题？torch 或者tensorflow的版本与Cuda版本不匹配？

经过逐一排查，发现前两者都没有问题，最后发现是tensorflow的版本与cuda版本不匹配导致的问题，cuda版本过高。

将Cuda版本降级后问题解决~ 以上~

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

fused

Adam

cannot

open

shared

fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决的相关文章

make c+++ 未定义的引用_Item21 优先使用std::make_unique和std::make_shared来代替new

std make shared是在 C 43 43 11中添加的一个专门用来创建智能指针的方法 xff0c 而不幸的是 std make unique在 C 43 43 11中并没有 xff0c 直到 C 43 43 14才引进来不过实现
ImportError: libQtGui.so.4: cannot open shared object file: No such file or directory

报错 xff1a File home sx125 anaconda3 envs pytorch lib python3 7 site packages cv2 init py line 3 in from cv2 import Import
linux下运行动态库问题 cannot open shared object file: No such file or directory

如果动态库不在同一级目录下 xff0c 则需要将以上文件的目录加载到动态库搜索路径中 xff0c 设置的方式有以下几种一将动态库路径加入到LD LIBRARY PATH环境变量 1 在终端输入 xff1a export LD LIBRA
Darknet问题：ERROR: Cannot load message class for [darknet_ros_msgs/BoundingBoxes].

运行darknet ros进行目标检测时 xff0c 通过 rostopic list查看到 darknet ros bounding boxes这个话题 xff0c 因此想查看该话题的数据 xff0c 在使用 rostopic echo
解决ERROR: cannot launch node of type [move_base/move_base]

最近拿了别人的程序跑 xff0c 直接将工作空间git了过来 xff0c 结果发现提示错误 xff1a ERROR cannot launch node of type move base move base Cannot locate n
error while loading shared libraries: libQtGui.so.4: cannot open shared object file:

qt4编写的界面在mini6410上运行失败 xff0c 总是提示错误 xff1a error while loading shared libraries libQtGui so 4 cannot open shared object f
Pycharm显示cannot find declaration to go to，设置子目录为根目录

Pycharm显示cannot find declartion to go to xff0c 设置子目录为根目录使用Pycharm用ctrl跳转函数时显示cannot find declaration to go to 原因可能有很多 x
解决 ERROR: cannot launch node of type [xxx]: can‘t locate node [xxx] in package [xxx]

背景 xff1a 从github下载的ros代码 xff0c 修改添加节点后 xff0c catkin make 编译通过 xff0c 但在运行launch文件时候报错原因 xff1a 1 从github上下载的很多文件 xff0c 下载
ImportError: cannot import name 'Flask'解决方法

在写bug的时候发现了这么一个错误 xff0c ImportError cannot import name Flask xff0c 自己建一个test脚本 xff0c 代码复制过去后发现可以运行 xff0c 经检查发现脚本文件的名称可能和
解决ROS中运行launch文件报错ERROR: cannot launch node of type[xxx/xxx]:xxx的问题

解决ROS中运行launch文件报错ERROR cannot launch node of type xxx xxx xxx的问题错误截图 xff1a 原因 xff1a 解决方式 xff1a 当时我出现的错误是 ERROR cannot
Unet实现眼底图像血管分割（二）

使用了google colaboratory的免费GPU进行训练调整了源代码的各个参数下面是configuration txt文件的解析 data paths 只有在修改了prepare datasets DRIVE py文件之后才能
访问共享网络文件夹

我需要通过 VBA 访问网络文件服务器上托管的文件夹该文件夹只能通过我有用户名和密码的服务帐户与普通用户帐户不同以书面形式访问通过 UI 我可以看到该文件夹并将其映射为本地驱动器但为了以书面形式访问它我需要从 Windows
在 VB.NET 中初始化类中的共享成员的最佳方法是什么？

我在互联网上查找是否有关于如何在初始化类中的共享成员的同时初始化实例变量的好示例我确实找到了一个可能适合答案的表达方式 Shared Sub New Declare shared members End Sub 但你也有标准 Sub Ne
fork的共享内存

我想在两个进程之间创建共享内存我用了fork 一个孩子试图改变这个共享的记忆而母亲又创造了另一个孩子所以新的孩子试图改变相同的记忆依此类推这是我的 C 编程代码 Ubuntu mylist ch NUL f fork if f p
VB .NET 共享函数（如果同时调用多次）

考虑我有一个共享功能 Public Shared Function CalculateAreaFromRadius ByVal radius As Double As Double square the radius Dim radiusS
Excel VBA中的公共静态变量

是否可以在一个过程中声明静态变量并使用 Excel VBA 在多个不同的过程中使用该变量 i e Public myvar as integer Sub SetVar static myvar as integer myvar 999 e
如何将 Tomcat 6 库管理到 %TOMCAT_HOME%/lib 下的子文件夹中？

我使用 Tomcat 6 0 20 和 JDK 1 6 0 13 如何从子文件夹加载库 TOMCAT HOME lib 无需将 jar 从子文件夹中取出并直接放入 TOMCAT HOME lib 我想这样做的原因是因为许多应用程序将共享大量
C++ 进程间通信的最佳方式

我有两个进程一个进程将查询另一个进程的数据在有限的时间内每秒 10000 个将会有大量的查询并且每秒将传输数据 gt 100 mb 数据类型将是整数类型双精度整数我的问题是用什么方式连接这个过程共享内存消息队列 lpc
在共享主机上从 HTML 页面生成 PDF 文件

我在主机上启用扩展等的权限非常有限但我希望通过 PHP 从 HTML 页面带有 css 图像生成 PDF 我有什么想法可以通过近乎零的 CL 访问等来实现这一点吗最好不是黑客依赖服务因为我将寻求长期使用生成要呈现到 PDF
适用于 Linux 的 NUMA 感知命名共享内存

Windows API 提供了 CreateFileMappingNuma 函数 http msdn microsoft com en us library windows desktop aa366539 v vs 85 aspx htt

随机推荐

基于ROS的hector-slam使用Kinect V1建图

距离值在ROS中被称为scan xff0c 并且姿态 xff08 位置 43 方向 xff09 信息会根据相对坐标关系而改变 xff0c 因此被称为tf xff08 transform xff09 一建图实际操作下载源码测试源码 xff
下载Fiddler后不知从何下手？来看看怎么抓包抓接口吧

1 Fiddler简介 Fiddler是位于客户端和服务器之间的一个代理 xff0c 类似于生活中厂家和客户之间的代理商或微商 2 Fiddler抓包实战当打开Fiddler时 xff0c 便会自动开启代理服务器 xff0c 监听端口号抓
socket、select、poll、epoll实现TCP并发处理

网络通信常用网络通信接口大概四种 xff0c socket select poll epoll 使用socket实现服务器的并发处理优点 xff1a 代码框架简单缺点 xff1a 碍于内存的限制 xff0c 并发量不会大 xff0c
find_package opencv

1 find package OpenCV 3 REQUIRED 通过OpenCV DIR变量寻找OpenCVConfig cmake文件 xff0c 默认在 usr share OpenCV中 set OpenCV DIR 34 34 指
工业通讯领域的总线、协议、规范、接口、数据采集与控制系统

一工控安全工控 xff0c 指的是工业控制自动化 xff0c 主要利用电气机械软件组合的方式实现 xff0c 即是工业控制系统 xff0c 或者是工厂自动化控制工控安全指的是工业控制系统的数据网络和系统安全随着工业信息化的迅猛
Java Web 开发详解

一 Web基础 1 Web 概述 Web 在英文中的含义是网状物网络在计算机领域 xff0c 它通常指的是后者 xff0c 即网络像 WWW 是由 3 个单词组成的 xff0c 即World Wide Web xff0c 中文含义是万
【无标题】amd卡顿，黑屏，解决办法

amd黑屏几秒原因是日光灯启动 xff0c 空调冰箱压缩机启动后照成的 xff0c 这种情况是220v的电路和显示器的hdmi线相隔太近分开或者换dp也可以 amd卡顿几秒 cpu百分百是amd显卡驱动设置问题改游戏模式为标准就行了
处理点云程序段错误process has died [pid 31695, exit code -11, cmd /home

问题 xff1a 编写了一个处理点云的程序编译全部通过 xff0c 播放点云bag包后运行程序时报错 xff1a plane fitter 1 process has died pid 31695 exit code 11 cmd hom
[ WARN] [1531227099.238940419]: MessageFilter [target=odom ]: Dropped 100.00% of messages so far. Pl

执行roslaunch rplidar ros rplidar launch 报错信息 WARN 1531227099 238940419 MessageFilter target 61 odom Dropped 100 00 of mes
libcurl第十课 HTTPS交互

场景跟乐橙云访问 xff0c 需要使用HTTPS协议额外配置 xff0c 否则执行返回CURLE UNSUPPORTED PROTOCOL错误 1 xff09 libcurl版本升级到7 61 0版本 2 xff09 libcurl项目
OpenCVSharp 入门

OpenCVSharp 入门了解对象和图像处理编程的开发人员应该能够轻松地学会如何使用OpenCVsharp 获得OpenCVSharp 要获得OpenCVSharp xff0c 要使用NuGet下载opencvsharp xff0c 它
头文件与库文件

函数的声明和定义 xff0c 编译过程声明 xff1a 让编译器知道函数的名字 xff0c 参数 xff0c 返回类型可以不存在一般需要在函数使用之前 xff0c 一定要先声明 xff0c 再使用定义 xff1a 函数的定义就是函数
ROS安装过程sudo rosdep init+rosdep update出现错误:'The read operation timed out'

xfeff xfeff 1 问题描述 xff1a 64 rosdepupdate readingin sources list data from etc ros rosdep sources list d ERROR unable to
Ubuntu Desktop下自动启动终端并运行脚本

进入桌面后按Alt 43 F2组合键或Win键 xff0c 输入gnome session properties选择出现的那个应用程序点击添加 xff0c 输入名称和命令 xff08 注意 xff0c 这里的命令就是一个单纯的shell
include头文件的顺序以及双引号和尖括号的区别？

Include头文件的顺序对于include的头文件来说 xff0c 如果在文件a h中声明一个在文件b h中定义的变量 xff0c 而不引用b h 那么要在a c文件中引用b h文件 xff0c 并且要先引用b h xff0c 后引用a
The manifest must not cotain the following tags:run_depend解决方法

当你在package xml中 xff0c 添加完run depend后 xff0c 编译出错 xff0c 显示The manifest must not cotain the following tags run depend xff0c
Astar算法

1 什么是Astar算法 xff1f Astar算法是一种图形搜索算法 xff0c 常用于寻路它是个以广度优先搜索为基础 xff0c 集Dijkstra算法与最佳优先 best fit 算法特点于一身的一种算法它通过下面这个函数来计算每
十进制转十六进制（C语言）

输入 xff1a Entern 666 输出 xff1a 29A include 34 stdio h 34 include 34 stdlib h 34 int main void int n a1 count 61 0 j count
STM32串口发送数据和接收数据方式总结

之前写了篇关于ESP8266使用AT指令进行互相通讯的实验 xff0c 在写STM32串口接发数据的程序中 xff0c 觉得有必要将之前学的有关于串口方面的使用经历加以总结串口发送数据 xff1a 1 串口发送数据最直接的方式就是标准调用
fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决

最近一个同学加载一个新的预训练模型时候碰到了这样一个问题 xff0c 帮他排查解决一下 xff1a File 34 data anaconda3 envs nlp lib python3 6 site packages torch util

fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决

fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决 的相关文章

随机推荐

热门标签

fused_adam.so: cannot open shared object file: No such file or directory问题排查与解决的相关文章