如何检索 slurm 脚本的内容?

2024-01-10

我几天前提交了一份工作,现在仍在运行。但我忘记了内容script.sh那天。还有script.sh已被删除。您知道如何恢复该脚本的内容吗?


在最新版本中,您可以使用以下命令检索您自己作业的作业脚本

scontrol write batch_script <job_id> <optional_filename>

来自man page https://slurm.schedmd.com/scontrol.html#OPT_write-batch_script:

将给定 job_id 的批处理脚本写入文件或标准输出。这 如果可选文件名,文件将默认为 slurm-.sh 没有给出论证。如果 - 是,脚本将被写入标准输出 给出而不是文件名。批处理脚本只能通过以下方式检索 管理员或操作员,或作业所有者。

在旧版本上,write batch_script命令不存在,但您可以使用以下命令获取脚本

scontrol show -ddd job <job_id>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何检索 slurm 脚本的内容? 的相关文章

  • 如何确保 slurm 中的 python 提交脚本位于发出 sbatch 命令的位置?

    我有一个运行的 python 提交脚本sbatch using slurm sbatch batch py 当我这样做时 事情无法正常工作 因为我认为 batch py进程没有继承正确的环境变量 因此 而不是运行batch py从哪里sba
  • Netlogo HPC CPU 使用百分比增加

    我通过以下方式使用无头 NetLogo 将作业提交到 HPC 服务器code bin bash N r20p q all q pe mpi 24 home abhishekb netlogo netlogo 5 1 0 netlogo he
  • K8s 失败rabbitmq-peer-discovery-k8s 集群

    我正在尝试使用 Rabbitmq peer discovery k8s 插件在 Kubernetes 上启动 RabbitMQ 集群 并且我总是只有一个 pod 运行并准备就绪 但下一个总是失败 我尝试对配置进行多次更改 这就是至少一个 P
  • 等待用户的所有作业完成,然后再将后续作业提交到 PBS 集群

    我正在尝试调整一些 bash 脚本以使它们在 pbs questions tagged pbs 簇 各个任务由由主脚本启动的多个脚本执行 到目前为止 这个主脚本在后台启动多个脚本 通过附加 使它们在一台多核机器上并行运行 我想用以下方式替换
  • 如何在集群中为一个节点和所有节点运行计划方法?

    我有一个在集群中运行的 Glassfish 3 1 2 和一个 EJB 3 1 应用程序 我的应用程序中需要两种预定方 法 一种每天只运行一次 在单个节点上 以及其他在所有节点上运行的类型 每 1 2 分钟 它们不需要运行同步方式 要求只是
  • nginx - php-fpm 集群

    我有三台 php fpm 服务器和一台 nginx 服务器 我想使用 nginx 服务器对 php fpm 进行负载平衡 php fpm 服务器1 192 168 10 31 php fpm 服务器2 192 168 10 32 php f
  • slurm:如何在另一个用户下提交作业并防止读取其他用户的文件?

    基于以下thread https stackoverflow com q 44540590 2402577 我正在尝试向另一个用户发送作业 我登录的身份是main user 并且 slurm 作业通过以下方式提交main user那可以做r
  • Ray on slurm - 初始化问题

    我写这篇文章是因为自从我使用 slurm 以来 我一直无法正确使用 ray 每当我使用命令时 ray init trainer A3CTrainer env my env 我已经在tune上注册了我的env 程序崩溃并显示以下消息 core
  • docker引擎swarm模式需要服务发现

    我对 docker swarm 感到困惑 据我所知 在 docker 引擎为 swarm 模式提供本机支持之前 运行 swarm 的旧方法是在容器中运行管理器和工作人员 旧的容器化 Swarm 的文档解释了如何使用 consul etcd
  • WebLogic负载均衡

    我目前正在开发一个受 WebLogic 集群环境支持的项目 我已经成功设置了集群 但现在我想要一个负载平衡解决方案 目前 仅出于测试目的 我正在使用 WebLogic 的HttpClusterServlet with 循环赛负载均衡 是否有
  • 什么分布式消息队列支持百万级队列?

    我正在寻找一个分布式消息队列 它将支持数百万个队列 每个队列每秒处理数十条消息 消息会很小 几十个字节 而且我不希望队列变得很长 每个队列最多有几十条消息 但是当系统运行时 队列应该保持相当长的状态空的 我不确定集群中有多少个节点 可能取决
  • 节点集群工作人员内存使用情况

    有谁知道是否有一种独立于平台的方法来获取工作人员的内存使用情况 我希望它会像这样工作 console log App process memoryUsage process memoryUsage cluster on online fun
  • 使用 qsub 提交连续且独立的作业的速度有多快?

    这个问题与pbs 作业忙时无输出 https stackoverflow com questions 13804373 pbs job no output when busy 即 当 PBS Torque 处于 忙 状态时 我提交的一些作业
  • JSF 2.0 应用程序的水平扩展

    鉴于 JavaServer Faces 在服务器端本质上是有状态的 建议使用哪些方法来水平扩展 JSF 2 0 应用程序 如果一个应用程序运行多个 JSF 服务器 我可以想象以下场景 Sticky Sessions send all req
  • 仅在一个WebLogic集群节点上运行@Scheduled任务?

    我们正在集群 WebLogic 10 3 4 环境中运行一个 Spring 3 0 x Web 应用程序 war 其中包含夜间 Scheduled 作业 但是 当应用程序部署到每个节点时 使用 AdminServer 的 Web 控制台中的
  • 大规模分布式系统中的日志文件

    我在网格和 HPC 领域做了很多工作 对于分布在数百 或在某些情况下数千 服务器上的系统 我们面临的最大挑战之一是分析日志文件 当前日志文件本地写入每个刀片上的磁盘 但我们也可以考虑使用 UDP Appender 等发布日志信息并集中收集
  • SunGridEngine、Condor、Torque 作为 PVM 的资源管理器

    有人知道哪个资源管理器适合 PVM 吗 或者我不应该使用 PVM 而是依赖 MPI 或其任何版本 例如 MPICH 2 还有其他更好的吗 使用 PVM 的主要原因是因为在我之前开始这个项目的人假设使用 PVM 然而 现在这个项目是我的了 他
  • SLURM 每个节点提交多个任务?

    我发现了一些非常相似的问题 这些问题帮助我得到了一个似乎有效的脚本 但我仍然不确定我是否完全理解为什么 因此这个问题 我的问题 示例 在 3 个节点上 我想在每个节点上运行 12 个任务 总共 36 个任务 此外 每个任务都使用 OpenM
  • 集群环境下的Spring Singleton

    正如中所讨论的this https stackoverflow com questions 1194129 singleton in cluster environmentpost 不适合使用单例聚集的环境 因为不同 JVM 中有多个单例对
  • 如何通过点积获得峰值 CPU 性能?

    Problem 我一直在研究 HPC 特别是使用矩阵乘法作为我的项目 请参阅我的个人资料中的其他帖子 我在这些方面取得了不错的成绩 但还不够好 我退后一步 看看我在点积计算方面能做得如何 点积与矩阵乘法 点积更简单 并且允许我测试 HPC

随机推荐