Slurm：为什么在 sbatch 中使用 srun？

2023-12-23

在 sbatch 脚本中，您可以直接启动程序或脚本（例如可执行文件myapp）但在许多教程中人们使用srun myapp反而。

尽管阅读了有关该主题的一些文档，我不明白其中的区别以及何时使用这些语法.

我希望这个问题足够精确（SO的第一个问题），提前感谢您的回答。

The srun命令用于创建作业“步骤”。

首先，它将带来更好的报告资源使用情况；这sstat https://slurm.schedmd.com/sstat.html命令将为启动的进程提供实时资源使用情况srun，并且每个步骤（每次调用 srun）都将在记帐中单独报告。

其次，它可以用来设置串行程序的多个实例（仅使用一个 CPU 的程序）到单个作业中，并在作业分配内对这些程序进行微调度。

最后，对于并行作业，srun也将扮演重要角色启动并行程序并设置并行环境。它将根据请求启动尽可能多的程序实例--ntasks为作业分配的 CPU 上的选项。如果是MPI https://en.wikipedia.org/wiki/Message_Passing_Interface程序中，它还将处理 MPI 库和 Slurm 之间的通信。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

HPC

slurm

Slurm：为什么在 sbatch 中使用 srun？的相关文章

C++性能优化系列——矩阵转置(八)IPP转置API性能测试

本篇记录Intel 高性能计算函数库IPP中的转置函数ippiTranspose 8u C1R的执行情况方便性能优化系列篇中转置实现做性能对比函数说明解释来自IPP2018发布文档 Intel Integrated Performan
高性能计算(HPC)和智能计算理解

1 现代终端设备一般都跟云端服务器相连但只要可能我们都希望计算可以在本地终端解决这样做的好处是多方面的既可以减小网络带宽的压力又可以避免网络传输产生的时延还可以让用户的数据更安全现代终端设备一般用一个片上系统 SoC 做计算
如何让SBATCH通过电子邮件发送标准输出？

我想让slurm系统发送myprogram计算完成后通过电子邮件输出所以我写了SBATCH如下 bin bash l SBATCH J MyModel SBATCH n 1 Number of cores SBATCH t 1 00 00
slurm 集群的最少计算机数量是多少

我想设置一个SLURM集群我至少需要多少台机器我可以从两台机器开始一台仅是客户端一台既是客户端又是服务器吗正如 Carles 所写如果您愿意您可以只使用一台计算机同时运行控制器 slurmctld 和工人 slurmd 守
多分区作业的批处理脚本？

我正在开发一个项目该项目在大型计算集群的两个不同分区上运行程序我想使用批处理脚本来运行它但搜索后仍然不清楚是否如何从单个批处理脚本中在两个不同的分区上分配和运行程序这就是我想做的事情 bin bash SBATCH partit
Slurm：为什么在 sbatch 中使用 srun？

在 sbatch 脚本中您可以直接启动程序或脚本例如可执行文件myapp 但在许多教程中人们使用srun myapp反而尽管阅读了有关该主题的一些文档我不明白其中的区别以及何时使用这些语法我希望这个问题足够精确 SO的第一个问题
如何在 slurm 作业期间监控资源？

我正在我们的大学集群普通用户无管理员权限上运行作业该集群使用 SLURM 调度系统我有兴趣绘制随时间推移即作业运行时的 CPU 和内存使用情况我知道关于sacct and sstat我正在考虑将这些命令包含在我的提交脚本中
SLURM 集群中出现错误 - 检测到 1 个 oom-kill 事件：如何改进正在运行的作业

我在 SLURM 集群中工作同时运行多个进程在多个输入文件上并使用相同的 bash 脚本在作业结束时进程被终止这是我得到的错误 slurmstepd error Detected 1 oom kill event s in st
vCPU 是否可以使用两台不同硬件计算机的不同 CPU

我搜索过这个问题但似乎没有得到公平的答案假设我不想创建一个具有 vCPU 的虚拟机并且该 vCPU 必须有 10 个核心但我只有 2 台计算机每台计算机有 5 个物理 CPU 核心是否可以通过依赖这两个物理 CPU 来创建一个
在 IBM Cloud 上使用 Spectrum LSF 管理数据

在 IBM Cloud 上使用 Spectrum LSF 管理数据在云环境中处理 HPC 工作负载时要解决的一个关键挑战是如何以最佳方式管理运行工作负载所需的数据以及可能需要分析以进行进一步处理和决策的输出通过使用部署在 IBM C
在集群的节点上启动 Jupyter Notebook（高性能计算或 HPC 设施）

我想在集群的一个节点上运行 jupyter 笔记本不在登录节点上我可以在登录节点上远程运行 jupyter 笔记本但这会不必要地减慢集群的使用速度请指导我如何从本地桌面在节点上启动 jupyter 笔记本我们的集群使用PBS作业提
如何检索 slurm 脚本的内容？

我几天前提交了一份工作现在仍在运行但我忘记了内容script sh那天还有script sh已被删除您知道如何恢复该脚本的内容吗在最新版本中您可以使用以下命令检索您自己作业的作业脚本 scontrol write batch s
如何获取 SLURM 数组作业中失败和已完成作业的计数

我正在使用 slurm 运行多个数组作业对于给定的数组作业 ID 假设为 885881 我想列出失败作业和已完成作业的计数像这样的事情 Input
slurm：如何在另一个用户下提交作业并防止读取其他用户的文件？

基于以下thread https stackoverflow com q 44540590 2402577 我正在尝试向另一个用户发送作业我登录的身份是main user 并且 slurm 作业通过以下方式提交main user那可以做r
是否可以提交一系列不同的工作来进行 slurm ？

例如我有一个名为myScript那个过程one输入文件我有一个文件名列表也就是说我需要运行 myScript
如何更新Slurm中的作业节点号？

我有一项待处理的工作我想调整它的大小我试过 scontrol update job
SLURM sacct 显示“batch”和“extern”作业名称

我已将作业提交到 SLURM 队列该作业已运行并完成然后我使用以下命令检查已完成的作业sacct命令但是查看 sacct 命令的结果我注意到了我没有预料到的其他结果 JobID JobName State NCPUS Timelim
MPI_Isend 和 MPI_Irecv 似乎导致死锁

我在 MPI 中使用非阻塞通信在进程之间发送各种消息然而我似乎陷入了僵局我用过PADB see here http padb pittman org uk 查看消息队列并得到以下输出 1 msg12 Operation 1 pendi
大规模分布式系统中的日志文件

我在网格和 HPC 领域做了很多工作对于分布在数百或在某些情况下数千服务器上的系统我们面临的最大挑战之一是分析日志文件当前日志文件本地写入每个刀片上的磁盘但我们也可以考虑使用 UDP Appender 等发布日志信息并集中收集
关于并行任务的 `srun ... >output_file` 的语义

抱歉这个问题需要大量的积累但总而言之它是关于许多并行实例的条件srun gt output file会或不会导致某些进程任务破坏其他进程任务产生的输出案例 0 仅 bash 无 SLURM 假设prog 0 sh是以下玩具脚本

随机推荐

如何自动更新实体框架函数导入

我正在使用实体框架来调用我的存储过程我正在使用函数导入向导来完成该过程以创建函数导入和复杂类型我遇到的问题是我想找到一种方法来轻松刷新所有复杂类型今天当存储过程发生变化时我的流程是 1 使用 EF 更新向导刷新存储过程 2 转到模
SQLALCHEMY/PANDAS - SQLAlchemy 将 Pandas to_sql 的列读取为 CLOB

我已将数据集写入数据框 inv info
有关于 Apache 如何处理文件上传的文档吗？

我花了几个小时在谷歌上搜索以及搜索 Apache 站点但我找不到任何有关 Apache 如何处理文件上传尤其是大文件上传的文档我读了轶事 http www mail archive com php general lists php
气流：无法连接到（'0.0.0.0'，8080）

我使用的是 Ubuntu 16 04 我已经使用 pip 安装了 Airflow 下一步 airflow initdb 2017 07 29 12 20 23 483 init py 57 INFO Using executor Seque
如何使用 XmlDocument 创建 XML 文档？

如何创建这样的 XML 文档
leetcode中二叉树的类定义解释

希望有人能帮助我了解这门课是如何运作的我目前正在 udemy 中学习 JavaScript 算法它们解释如何在二叉树中执行所有操作的方式与 leetcode 显示的稍有不同课程中树的定义与leetcode相同或非常相似 class
Lib Gdx json 序列化异常和缺少无参数构造函数

当尝试执行这段代码时 public void load String filename FileHandle file Gdx files external filename bim Json json new Json String te
在.net框架中测试

我创建了一个针对 NET Framework 4 6 1 的单元测试项目测试显示在测试资源管理器中并在 Visual Studio 2017 中正常运行我想设置一个构建过程所以我想从命令行运行测试我尝试使用 mstest 但这没有
詹金斯正在重新启动，请稍候 - 等待很长时间

我更新了一些插件并重新启动了詹金斯但现在它说 Jenkins 正在重新启动请稍候当 Jenkins 准备就绪时您的浏览器将自动重新加载花费了太多时间从最后 40 分钟开始等待我只有 1 个项目大约有 20 个版本我已经重新
Tkinter - 使用自动换行计算文本小部件中的行数

我想知道如何获取启用自动换行的 Tkinter Text 小部件中的行数在此示例中文本小部件中有 3 行 from Tkinter import root Tk text Text root width 12 height 5 wrap
我从 .ssh 文件夹中删除了known_hosts 文件，并且无法在 BitBucket 存储库中拉取或推送

我犯了一个错误删除了 ssh 文件夹中的 known hosts 文件现在我无法在 BitBucket 存储库中拉取或推送我该如何解决尝试执行 ssh T email protected cdn cgi l email protec
从第二个 ViewController 返回到第一个 ViewController

我正在构建一个当前有 3 个 ViewController 的应用程序其中之一是在成功登录后使用的因此与这个问题无关当我发现 Storyboard 无法提供所需的精细控制时我混合使用 Storyboard 并以编程方式构建内容第一
使用打字稿模板将 create-react-app 更新到 4.0 时出错

我要更新react scripts到下一个版本 4 0 0 这样我就可以使用本指南使用快速刷新功能here https gist github com iansu 282dbe3d722bd7231fa3224c0f403fa1 但是当重新
金字塔 postgresql 连接

我对金字塔完全陌生我正在尝试开发一个同时使用金字塔和 postgresql 的应用程序但我对如何配置 sripts 目录中的initializedb py 文件尤其是初始化数据库完全感到困惑我正在使用 PostgreSQL 9 1
在android布局中layout_height =“0dip”的效果/含义是什么

我见过几个使用的例子 android layout height 0px 或 0dip 但我不明白这样做的影响看起来这会使布局高度为 0 像素该值是否有所减轻但还有一些其他因素例如重量或任何父视图的高度是的你对重量的看法是正
Twig 将内容附加到块

在树枝模板中是否可以将内容附加到块中例如请考虑下面的模板文件布局 html twig block content endblock content 内部 html twig block css a color fff body ba
通过Python suds在JIRA中创建问题时设置受让人字段

使用 JIRA 版本 4 2 使用 Python 2 7 和 suds 0 4 如何创建受让人字段集的问题下面的代码中将忽略受让人字段 new issue client service createIssue auth project N
使用Webpack将Vue暴露到全局

我正在使用旧版 Rails 应用程序该应用程序已部分迁移为使用 Webpacker 和 Vue 我们还有一个通过 CDN 加载的遗留脚本该脚本也需要使用 Vue 但是我们不想将 Vue 捆绑到其中而只使用旧版 Rails 应用程序中
GNU Make 支持文件名中的“%”吗？

在 GNU Make 中是否可以依赖包含以下内容的文件在文件名中我有这样的事情 foo results 10 dat gnuplot config plt 虽然我当然可以选择不同的文件名但很高兴知道是否应该始终避免或者是否有一种
Slurm：为什么在 sbatch 中使用 srun？

在 sbatch 脚本中您可以直接启动程序或脚本例如可执行文件myapp 但在许多教程中人们使用srun myapp反而尽管阅读了有关该主题的一些文档我不明白其中的区别以及何时使用这些语法我希望这个问题足够精确 SO的第一个问题

Slurm：为什么在 sbatch 中使用 srun？

Slurm：为什么在 sbatch 中使用 srun？ 的相关文章

随机推荐

热门标签

Slurm：为什么在 sbatch 中使用 srun？的相关文章