我正在研究 MPICH2 自动附带的新流程管理器,但直到现在我无法弄清楚这个实现有什么大的进步,有人知道一个好的教程或有一些经验吗?
argonne wiki 有点太简单了:http ://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager
2658 次
2 回答
9
从我工作的角度来看,最大的进步是流程启动的可扩展性。在基于 MPICH2 的 MPI 实现中使用先前的进程启动器启动 8000 多个任务作业非常缓慢,并且由于超时或其他网络问题而经常失败,这几乎排除了基于 MPICH2 的 MPI 用于我们最大的作业。但是 Hydra 有一个很好的分层启动模型,它也可以利用你的资源管理器。
拓扑感知分配策略也很好,但与作业启动失败(或花费数小时)和作业成功之间的差异相比,这是二阶效应。
于 2011-05-23T03:08:04.070 回答
5
我完全同意乔纳森关于工作启动时间显着改善的观点。此外,Hydra 通常在几乎所有方面都比以前的流程管理器更有用、更健壮。它启动更可靠,具有更多功能(进程核心绑定、基于格式的输出文件重定向、资源管理器和批处理调度程序集成等),并且比 MPICH2 以前的所有进程管理器具有更少的神秘错误消息。
另一个关键考虑因素是 hydra 得到积极维护,而此时几乎所有其他 PM 都已弃用和/或不受支持。因此,如果您报告 hydra 中的错误,它可能会得到修复,而 MPD 或 remshell 则不是这样。
AFAIK,如果您知道自己在做什么,您还可以使用 hydra 启动非 MPI 作业,例如 UPC 程序。
于 2011-05-23T17:21:11.830 回答