我正在研究 MPICH2 自动附带的新流程管理器,但到目前为止我无法弄清楚这个实现有什么重大进步,有人知道一个好的教程或有一些经验吗?
argonne wiki 有点太简单了:http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager
从我工作的角度来看,最大的进步是流程启动的可扩展性。在基于 MPICH2 的 MPI 实现中使用以前的进程启动器启动 8000 多个任务作业速度慢得无法使用,并且经常会由于超时或其他网络问题而失败,这几乎排除了我们最大的作业基于 MPICH2 的 MPI 的可能性。但是 Hydra 有一个很好的分层启动模型,它也可以利用你的资源管理器。
拓扑感知的分配策略也很好,但与作业启动失败(或花费数小时)和作业成功之间的差异相比,这是二阶效应。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)