我想在一台机器上运行多个工作守护进程。按照达米安弗朗索瓦的回答关于slurm 集群的最少计算机数量是多少可以办到。问题是目前我只能在一台机器上执行 1 个工作守护进程。例如
当我跑步时
sudo slurmd -N linux1 -cDvv
sudo slurmd -N linux2 -cDvv
当我运行 linux 2 时,linux 1 出现故障。是否可以在一台机器上运行多个工作守护进程?
这是我的slurm.conf file
由于您的意图似乎只是测试 Slurm 的行为,因此我建议您使用前端模式,您可以在同一台机器中创建虚拟计算节点。
在他们的FAQ,您有更多详细信息,但基本上您必须配置您的安装才能使用此模式:
./configure --enable-front-end
并配置节点slurm.conf
NodeName=test[1-100] NodeHostName=localhost
在该指南中,他们还解释了如何通过更改端口在同一节点中启动多个真实的守护进程,但出于我的测试目的,这是没有必要的。
祝你好运!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)