MxNet系列——how_to——env_var

2023-05-16

博客新址: http://blog.xuezhisd.top
邮箱：xuezhisd@126.com

环境变量

环境可以修改MXNet的一些设置。一般情况下，你不需要修改这些设置。本节将它们罗列出来，用于参考。

设置线程数目

MXNET_GPU_WORKER_NTHREADS (默认值=2)
- 每个GPU上，进行计算的最大线程数
MXNET_GPU_COPY_NTHREADS (默认值=1)
- 每个GPU上，内存复制的最大线程数
MXNET_CPU_WORKER_NTHREADS (默认值=1)
- CPU上的计算任务的最大线程数
MXNET_CPU_PRIORITY_NTHREADS (默认值=4)
- 优先的CPU任务的线程数

内存选项

MXNET_EXEC_ENABLE_INPLACE (默认值=true)
- 在符号计算中，是否使用原地（计算）优化。
MXNET_EXEC_MATCH_RANGE (默认值=10)
- 符号计算内存分配器中的粗略匹配规模
- 如果不想使用（图的）节点间共享内存（用于调试时），可以将该环境变量设置为0。
MXNET_EXEC_NUM_TEMP (默认值=1)
- 每个设备上分配的临时工作空间的最大数目
- 将它设置成比较小的数字，可以节省GPU内存。它也可能会降低并行度，但这通常是可接受的。
MXNET_GPU_MEM_POOL_RESERVE (默认值=5)
- 分配给非GPU数组的GPU内存的比例，比如内核启动器或cudnn句柄空间。
- 如果在迭代多次之后，看到一个来自内核启动器的内存溢出错误，尝试增大该环境变量的值。

Engine Type

MXNET_ENGINE_TYPE (默认值=ThreadedEnginePerDevice)
- MXNet的实质执行引擎的类型。
- 可选值：
  - NaiveEngine: 非常简单的引擎，使用主线程来计算。
  - ThreadedEngine: 使用全局线程池来调度作业。
  - ThreadedEnginePerDevice: 每个GPU上分配线程。

控制数据通信

MXNET_KVSTORE_REDUCTION_NTHREADS (默认值=4)
- 用于大数组求和的CPU线程数
MXNET_KVSTORE_BIGARRAY_BOUND (默认值=1e6)
- 大数组的最小尺寸
- 当数组的容量大于该阈值时，将使用线程 MXNET_KVSTORE_REDUCTION_NTHREADS 进行规约。
MXNET_ENABLE_GPU_P2P (默认值=1)
- 如果为True，MXNet尝试使用GPU的 peer-to-peer 通信（前提是P2P可用），当 kvstore 的类型是 device 时。

Memonger

MXNET_BACKWARD_DO_MIRROR (默认值=0)
- 在训练过程中，是否执行 mirror 以节省设备存储。
- 当设置成1时，在前向传播过程中，图计算器将会对一些层的特征图进行 mirror 操作，并抛弃它们；但当需要时，会重新计算这些抛弃的特征图。MXNET_BACKWARD_DO_MIRROR=1 时，将会节省 30%~50% 的设备内存，同时保持 95% 的运行速度。
- 在MXNet中，mirror 的一个拓展叫做 memonger technology，它可以在保持75%运行速度的同时节省 O(sqrt(N)) 内存。

其它环境变量

MXNET_CUDNN_AUTOTUNE_DEFAULT (默认值=0)
- 用于卷积层的cudnn_tune的默认值。
- Auto tuning 默认是关闭的。For benchmarking, set this to 1 to turn it on by default.

设置最小内存使用

务必确保 min(MXNET_EXEC_NUM_TEMP, MXNET_GPU_WORKER_NTHREADS) = 1
- 默认设置满足这个条件。

设置更多的GPU并行

将 MXNET_GPU_WORKER_NTHREADS设置成一个较大的数（比如 2）
- 为了减少内存的使用，考虑设置 MXNET_EXEC_NUM_TEMP
这可能不会加速，尤其是图像任务。因为GPU通常会被充分利用（甚至在序列化作业中）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mxnet

How

env

var

MxNet系列——how_to——env_var 的相关文章

HOW TO install nam for ns2 on debian

Debian is convinent to install software packages for the tool aptl Like many other packages we can use apt get install n
E:Could not get lock /var/lib/apt/lists/lock - open (11: Resource temporarily unavailable)

出现这个问题的原因可能是有另外一个程序正在运行 xff0c 导致资源被锁不可用而导致资源被锁的原因 xff0c 可能是上次安装时没正常完成 xff0c 而导致出现此状况解决方法 xff1a 输入以下命令 sudo rm var cach
Could not get lock /var/lib/dpkg/lock 问题解决方法

今天在ubuntu上安装sqlite 时 xff0c 执行命令sudo apt get y install sqlite3 时 xff0c 系统提示 xff1a Could not get lock var lib dpkg lock op
金融分析与风险管理——风险价值（VaR）

金融分析与风险管理风险价值 VaR 1 风险价值 VaR 简述 1 1 Python可视化风险价值 2 VaR值的测度方法 2 1 方差协方差法 2 2 历史模拟法 2 3 蒙特卡洛模拟法 3 回溯检验 4 压力VaR 1 风险价值 V
How to use jupyterlab in Ubuntu 22.04

How to use jupyterlab in Ubuntu 22 04 Install Start Stop Install lwk qwfys pip install jupyterlab upgrade i http mirrors
【VAR模型

向量自回归 VAR 是一种随机过程模型用于捕获多个时间序列之间的线性相互依赖性 VAR 模型通过允许多个进化变量来概括单变量自回归模型 AR 模型 VAR 中的所有变量都以相同的方式进入模型每个变量都有一个方程式根据其自身的滞后值其
%ENV 不起作用，我无法使用共享库

我无法使用 ENV在我的 Perl 脚本上使用 var 来使用 Oracle 库 BEGIN ORACLE HOME usr lib oracle 10 2 0 3 client64 LD LIBRARY PATH ORACLE HOME
通过 html 按钮更改变量

我正在学习 javascript 我决定创建简单的石头剪刀布游戏我想让它可以通过按钮控制所以我用html做了这个 div div
var 在 Java 中做什么？

我的一个朋友注意到 var
为什么Java中每次long和double都工作时会有这么多类型的数字？

现在我一直在尝试学习Java编程我想知道为什么我们使用这样的东西Float short and int当我们可以只是使用Long and Double 我不明白那部分很好的问题特别是如果你来自这样的语言JavaScript它不区分数字
javascript变量初始化显示NaN

function sumArray numbers var sum for var i in numbers sum numbers i return sum console log sumArray 1 2 3 4 5 Hi all 结果
Clojure Ref、Var、Agent、Atom 之间的差异以及示例

我对 Clojure 很陌生你们能给我解释一下现实世界的场景吗我的意思是在哪里使用 Ref Var Agent Atom 我读过书但是仍然无法理解现实世界的例子我强烈推荐 The Joy of Clojure 或 programm
为什么Go中有两种声明变量的方式，有什么区别以及使用哪一种？

根据 Go 参考资料有两种声明变量的方法变量声明 http golang org ref spec Variable declarations 格式为var count 0 or var count int and 短变量声明 http
如何在 R 4.0.2 中安装“mxnet”包

下午好最近我在安装 mxnet 包时遇到了问题我尝试了几种代码变体但它们都没有真正安装这个包 1 cran lt getOption repos cran dmlc lt https apache mxnet s3 accelerat
使用 mxnet 的简单梯度下降

我正在尝试使用 MXNet 的梯度下降优化器来最小化函数 Tensorflow 中的等效示例是 import tensorflow as tf x tf Variable 2 name x dtype tf float32 log x tf
如何在 Node js 中访问 Laravel 环境变量？

我试图在我的 socket io 服务器安装中访问 laravel 的 APP KEY 环境变量但不知道如何访问任何 laravel 环境变量任何帮助表示赞赏检查此包中是否有 node jsdotenv https www npmjs
使用 var 和使用 function 声明 javascript 对象有什么区别？

我是一个迷茫的新手我在教程中读到您可以像这样创建一个 javascript 对象 function myObject this myProperty a string this myMethod function Method code
为什么下面的结果是零？ [复制]

这个问题在这里已经有答案了下面的每个 print 语句都会产生 0 0 var c Double 0 0 let a Int 1 let b Int 5 print a b Double a b 100 c Double a b 100
将 Fabric env.hosts 字符串作为变量传递在函数中不起作用

将 Fabric env hosts 字符串作为变量传递在函数中不起作用 demo py usr bin env python from fabric api import env run def deploy hosts command
如何找到运行代码的 conda 环境的名称？

我正在寻找一种好方法来从正在运行的代码或交互式 python 实例中找出我所在的 conda 环境的名称用例是我通过 miniconda 安装运行带有 Python 2 和 Python 3 内核的 Jupyter 笔记本默认环境是Py

随机推荐

Python中类成员函数均为虚函数的理解

python中类成员函数均为虚函数我们可以通过下面的函数见识其威力 class A def foo self print 39 a 39 class B A def foo self print 39 b 39 for x in A B
MxNet系列——Windows上安装MxNet

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 开发环境操作系统 xff1a Win7 64bit C 43 43 编译器 xff1a Visual Studio 2010
Eigen教程1 - 基础

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 固定大小的矩阵和向量参考链接 xff1a http eigen tuxfamily org dox 2 0 Tutorial
Eigen教程2 - 入门

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 安装Eigen 无需安装只需将Eigen位置添加到include路径中 Demo 1 MatrixXd xff0c X表示动
Eigen教程3 - 稀疏矩阵操作

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 稀疏矩阵操作操作和求解稀疏问题需要的模块 xff1a SparseCore SparseMatrix 和 SparseVec
Eigen教程4 - 稀疏矩阵快速参考指南

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 本文对稀疏矩阵SparseMatrix的主要操作进行了总结首先 xff0c 建议先阅读 Eigen教程2 稀疏矩阵操作关于
Eigen教程5 - 求解稀疏线性方程组

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com Eigen中有一些求解稀疏系数矩阵的线性方程组由于稀疏矩阵的特殊的表示方式 xff0c 因此获得较好的性能需要格外注意查看
Eigen教程6 - Matrix-free solvers

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com Matrix free solvers 像ConjugateGradient 和 BiCGSTAB这样的迭代求解器可以用在 m
Eigen教程7 - Eigen和Matlab的比较

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com Eigen和Matlab比较参考 http eigen tuxfamily org dox AsciiQuickRefere
MxNet系列——how_to——perf

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 性能下面是一些技巧 xff0c 以尽可能的获取MXNet的最佳性能数据对于输入数据 xff0c 需要注意以下内容 xff
MxNet系列——how_to——visualize_graph

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 如何将神经网络可视化为计算图该章节描述了如何在MXNet中使用在mx viz plot network来可视化 xff08
修改antlr错误信息输出格式的方法

找到 antlr DefaultFileLineFormatter java 修改类DefaultFileLineFormatter的函数getFormatString 我将其修改如下以适应vc的错误信息输出格式 package antl
MxNet系列——how_to——torch

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 如何将MXNet用作Torch的前后端本章节描述了如何将MXNet用作Torch的两个主要功能 xff08 前端和后端 xf
MxNet系列——how_to——smart_device

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 将深度学习库压缩成一个文件 xff0c 以便移植到智能设备中深度学习系统是复杂的 xff0c 并且常常有些依赖环境将深度学
MxNet系列——how_to——new_op

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 如何创建新的操作符网络层本节内容描述了创建新的MXNet操作符 xff08 或网络 xff09 的过程我们已经尽了最大努
MxNet系列——how_to——multi_devices

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 在多个CPU GPUs上以数据并行方式运行MXNet MXNet 支持在多个CPUs和GPUs上进行训练其中 xff0c 这
MxNet系列——how_to——model_parallel_lstm

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 使用模型并行的方式在多个GPUs上训练LSTM 由于复杂的数据依赖 xff0c LSTM评价很困难 LSTM的训练过程 xff
MxNet系列——how_to——index

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com MXNet 怎么办系列 How tos 提供了一系列的有关安装 xff0c 基本概念 xff0c 说明 xff0c 命令和使用
MxNet系列——how_to——faq

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 常见问题本节回答了 mxnet issues上的常见问题在提问前 xff0c 请先检查该页面如果你想要贡献本页面 xff
MxNet系列——how_to——env_var

博客新址 http blog xuezhisd top 邮箱 xff1a xuezhisd 64 126 com 环境变量环境可以修改MXNet的一些设置一般情况下 xff0c 你不需要修改这些设置本节将它们罗列出来 xff0c 用于

MxNet系列——how_to——env_var

环境变量

设置线程数目

内存选项

Engine Type

控制数据通信

Memonger

其它环境变量

设置最小内存使用

设置更多的GPU并行

MxNet系列——how_to——env_var 的相关文章

随机推荐

热门标签