MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library

2023-05-16

使用pytorch做分布式训练时，遇到错误：

Error: mkl-service + Intel(R) MKL: MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library.
    Try to import numpy first or set the threading layer accordingly. Set MKL_SERVICE_FORCE_INTEL to force it.

解决方案1：在环境变量增加设置

export MKL_SERVICE_FORCE_INTEL=1

解决方案2：在环境变量增加设置

export MKL_THREADING_LAYER=GNU

问题分析：

Grepping conda manifests, libgomp is pulled in by libgcc-ng, which is in turn pulled in by, uh, pretty much everything. So the culprit is more likely to be whoever's setting MKL_THREADING_LAYER=INTEL. As far as that goes, well, it's weird.


import os

def print_layer(prefix):
    print(f'{prefix}: {os.environ.get("MKL_THREADING_LAYER")}')

if __name__ == '__main__':
    print_layer('Pre-import')
    import numpy as np
    from torch import multiprocessing as mp
    print_layer('Post-import')

    mp.set_start_method('spawn')
    p = mp.Process(target=print_layer, args=('Child',))
    p.start()
    p.join()

See, if torch is imported before numpy then the child process here gets a GNU threading layer (even though the parent doesn't have the variable defined).

Pre-import: None
Post-import: None
Child: GNU

But if the imports are swapped so numpy is imported before torch, the child process gets an INTEL threading layer

Pre-import: None
Post-import: None
Child: INTEL

So I suspect numpy - or ones of its imports - is messing with the env parameter of Popen, but half an hour's search and I can't figure out how.

Ref: https://github.com/pytorch/pytorch/issues/37377

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library 的相关文章

如何从 C 文件中获取完整的汇编代码？

我目前正在尝试找出从相应的 C 源文件生成等效汇编代码的方法我使用 C 语言已经好几年了但对汇编语言的经验很少我能够使用以下命令输出汇编代码 S海湾合作委员会中的选项然而生成的汇编代码包含调用指令这些指令又跳转到另一个函数例如
Sandy-Bridge CPU规格

我能够将有关 Sandy Bridge E 架构的一些信息整合在一起但我并不完全确定所有参数例如L2 缓存的大小任何人都可以确认它们都是正确的吗我的主要来源是64 ia 32 架构优化手册 pdf http www intel
启用/禁用硬件锁定消除

我使用的是 glibc 2 24 版本它包含用于使用事务同步扩展例如 xbegin 和 xend 实现 pthread mutex lock 的锁省略路径硬件应该支持锁省略hle我认为CPU标志是为了硬件锁消除我使用的处理器是采用
*移动消除*插槽在 Intel CPU 中如何工作？

安德烈亚斯阿贝尔和简雷内克讨论移动消除 in 他们的论文描述了 uCA https dl acm org doi pdf 10 1145 3524059 3532396 4 1 4 移动消除然而这一招消除并不总是成功的我们开发了微
Intel芯片上的半精度浮点运算

Intel芯片上可以进行半精度浮点运算吗我知道如何加载存储转换半精度浮点数 1 但我不知道如何在不转换为单精度浮点数的情况下对它们进行加乘 1 https software intel com en us articles perf
从 C 调用 Intel 8086 汇编程序

我需要为汇编语言开发一个过程并从 C 语言调用该过程传递一个字符串并返回一个整数值我的组装程序独立运行良好我需要帮助将它们连接在一起程序应该在 Intel 8086 上运行我需要使用 MASM 或 emu8086 作为汇编器
将英特尔寄存器用于其“预期目的”是否会提高效率？

本文 http www swansontec com sregisters html声称每个寄存器都有其预期目的更重要的是当英特尔的工程师设计最初的 8086 处理器他们有每个人都有一个特殊的目的登记正如他们设计的指令集他
如何将两个 SSE 寄存器加在一起

我有两个 SSE 寄存器 128 位是一个寄存器我想将它们相加我知道如何在其中添加相应的单词例如我可以这样做 mm add epi16如果我在寄存器中使用 16 位字但我想要的是类似的东西 mm add epi128 不存在它将使
SetPixel 太慢了。有没有更快的方法来绘制位图？

我正在开发一个小型绘画程序我在位图上使用 SetPixel 来绘制线条当画笔尺寸变大例如 25 像素时性能会明显下降我想知道是否有更快的方法来绘制位图以下是该项目的一些背景我使用位图这样我就可以利用图层就像在 Photo
有没有办法判断SMM中断发生了？

对于某些以编程方式定义的间隔有没有办法确定SMM https en wikipedia org wiki System Management Mode当前核心上是否发生了条目从 Nehalem 开始 MSR 寄存器 0x 34 称为MS
如何完全关闭 TBB 代码中的线程

注意这不是重复的这个问题 https stackoverflow com questions 3786408 number of threads used by intel tbb 给定一个与 TBB 并行的复杂软件我如何完全关闭线程
IText 编辑或删除 PDF 上的图层

H All 我正在使用 IText 在 PDF 上添加文本图层现在我想编辑PDF上的现有图层图层也是仅由IText创建的看来 IText 没有这样的方法支持我想到的另一种方法是删除现有图层并在其位置上放置新图层看来 IText 也
创建可训练权重的 Keras 层

edit请参阅底部以了解我如何解决此问题我写了自己的Keras层其构建方法如下 class Multed Weights Layer def init self input dim output dim kwargs self outp
存储缓冲区是否保存现代 x86 上的物理地址或虚拟地址？

现代 Intel 和 AMD 芯片大存储缓冲区 https stackoverflow com a 54880249 149138在提交到 L1 缓存之前缓冲存储从概念上讲这些条目保存存储数据和存储地址对于地址部分这些缓冲区条目是否
Haswell 微架构在性能中没有停滞周期后端

我在 Haswell CPU Intel Core i7 4790 上安装了 perf 但性能列表不包括 stalled cycles frontend 或 stalled cycles backend 我检查了http www int
混洗两个 __m128i 的 64 位部分的最佳方法

我有两个 m128is a and b 我想进行洗牌以便高 64 位a落在低 64 位dst和低 64 位b落在上64dst i e dst 0 63 a 64 127 dst 64 127 b 0 63 相当于 m128i dst mm
如何快速知道Gimp中的图层尺寸？

每次我想知道 Gimp 中的图层尺寸时我都会打开缩放图层对话框来获取它有没有更好的方法可以一目了然可能是一些配置选项将其显示在图层名称的底部右侧或底部栏中也许这可能是 Gimp 功能请求谢谢你 GIMP 确实有方法配置状态
OpenCL 在调用 clGetPlatformIDs 时崩溃

我是 OpenCL 新手在配备 Intel R HD Graphics 4000 运行 Windows 7 的 Core i5 计算机上工作我安装了支持 OpenCL 的最新 Intel 驱动程序 GpuCapsViewer 确认我有
假设没有非时间指令，“xchg”是否包含“mfence”？

我已经看过了这个答案 https stackoverflow com a 50279772 391161 and 这个答案 https stackoverflow com a 19099164 391161 但似乎都没有清楚明确地说明等价或
BOOST_LIKELY 和 __builtin_expect 仍然相关吗？

我明白所解释的内容here https stackoverflow com questions 7346929 why do we use builtin expect when a straightforward way is to us

随机推荐

土地覆盖/土地利用简介及数据集

1 简介土地覆盖 xff1a 地球表面当前所具有的自然和人为影响所形成的覆盖物 xff0c 是地球表面的自然状态 xff0c 如森林草场农田土壤冰川湖泊沼泽湿地及道路等土地利用 xff1a 是人类在生产活动中为达到一定的经济
华为云OBS数据桶使用

华为云OBS数据桶的使用模式和AWS类似 xff0c 可以参考这个链接入门总览对象存储服务 OBS 快速入门华为云 huaweicloud com 概览 OBS最基础的入门操作包括创建桶上传对象和下载对象 xff0c 通过这三个操作
Landsat Fractional Snow Covered Area Product（Landsat雪比例产品，含云掩膜）

Landsat Fractional Snow Covered Area Product 是一套30米的雪比例产品 xff08 含云掩膜 xff09 该产品包括2部分一是雪比例产品fSCA xff0c 产品文件说明 LXSS US HHH
keras加载模型错误：“bad marshal data“

问题 xff1a 使用python 3 8环境下的keras加载python 3 6环境保存的模型文件时 xff0c 出现错误 ValueError bad marshal data unknown type code 原因 xff1a m
用脚本批量执行redis命令

最近在维护一个用redis做缓存的项目时 xff0c 遇到了产品需要不定时清除用户数据的需要 xff0c 由于每次要清除的用户数据很多 xff0c 每次手动删除的话比较繁琐 xff0c 最后采用了批处理脚本的方式来执行清除的命令首先将要执
解决AttributeError: module ‘keras.utils.generic_utils‘ has no attribute ‘populate_dict_with_module**

问题 xff1a 使用keras 2 2 4和tensorflow2 5组合时 xff0c import keras出现错误 AttributeError module 39 keras utils generic utils 39 has
windows系统下conda正常安装gdal后import gdal导入出错:ImportError: DLL load failed

问题 xff1a Window10系统 xff0c 使用conda安装gdal后在cmd中可以import gdal xff0c 但在pycharm使用该虚拟环境时 xff0c import gdal则报错 ImportError DLL
Error running docker container: starting container process caused “exec: \“python\“: executable file

问题 xff1a miniconda3虚拟环境创建python环境 xff0c 使用下面Dockerfile编译docker镜像 FROM cuda10 2 pt1 5 09061 COPY workspace WORKDIR worksp
pytorch历史版本安装

1 whl下载安装 pytorch 离线 whl包官方下载地址 xff1a https download pytorch org whl torch stable html 从里面找就行了 xff0c 一般比直接pip网上下载对应的资源快得
allow_growth控制tensorflow显存动态增长无效问题

问题 xff1a tensorflow1 15环境使用config gpu options allow growth 61 True xff0c 控制显存动态增长 xff0c 发现无效 xff0c 显存仍然会被完全占用 config 61
标准规范查询与下载

1 标准规范查询国标行标地方规范等可以在全国标准信息公共服务平台查询 xff0c 例如国标在 xff1a 国家标准目录查询全国标准信息公共服务平台 samr gov cn 2 标准规范下载如果标准规范右侧显示全文链接 xff0c
视频ts格式转mp4

工具下载 xff1a TS转MP4 zip 使用方法 xff1a 1 xff0c 把压缩包解压到TS文件的目录里 2 xff0c 双击run bat 3 xff0c 等待运行完成 xff0c 出来同名的MP4文件 4 xff0c 删除TS文
Ubuntu安装特定版本python和pip

安装python 更新apt get xff08 推荐 xff01 xff01 xff01 xff09 apt get update 安装python3 6 apt get install python3 6 安装后默认不识别python命
apt-get清理安装包

rm rf var lib apt lists
Dockerfile最小化构建镜像：减少层数、清理无用数据、多段构建

docker的官方虽然有数十万计的免费镜像 xff0c 但是出于某些安全考虑 xff0c 一般不会使用免费镜像 xff0c 因此这就需要我们自己制作镜像 xff0c 制作的镜像如果很大 xff0c 那么在镜像上传下载的时候是很不方便的 x
Gson 用户指南(中文)

整体概括 Gson 是一个将Java对象转换成Json字符串 xff0c 将Json字符串转换陈成Java对象的工具库 Gson能够处理任何类型的Java对象 xff0c 甚至包括那些你没有源代码的Java类不了解对象的属性 Gson能干
问题：Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

I 39 ve seen this error message for three different reasons with different solutions 1 You have cache issues I regularly
Linux 中的内存（cache，buffer等）

在Linux系统中 xff0c 为了提高文件系统性能 xff0c 内核利用一部分物理内存分配出缓冲区 xff0c 用于缓存系统操作和数据文件 xff0c 当内核收到读写的请求时 xff0c 内核先去缓存区找是否有请求的数据 xff0c 有就
Linux下NVIDIA驱动手动安装

1 查看当前电脑的显卡型号 lshw numeric C display 执行完毕后我的显卡型号为 GTX 960M xff1a 2 下载NVIDIA官方驱动到NVIDIA的官方驱动网站下载对应显卡的驱动程序 xff0c 下载后的文件格式
MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library

使用pytorch做分布式训练时 xff0c 遇到错误 xff1a Error mkl service 43 Intel R MKL MKL THREADING LAYER 61 INTEL is incompatible with lib

MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library

MKL_THREADING_LAYER=INTEL is incompatible with libgomp.so.1 library 的相关文章

随机推荐

热门标签