0

我对 MPI 没有太多经验,我试图了解 allreduce 是如何工作的。下面是一个受IPython 教程启发的简单示例。2 MPI 引擎从 IPython 笔记本仪表板在本地计算机上启动:

In [1]: import numpy as np
        from IPython.parallel import Client

In [2]: c = Client(profile='mpi')

In [3]: view = c[:]

In [4]: view.scatter('a', np.arange(4.))
Out[4]: <AsyncResult: scatter>

In [5]: %%px
        from mpi4py import MPI
        import numpy as np

        print MPI.COMM_WORLD.allreduce(np.sum(a), op=MPI.SUM)
[stdout:0] 1.0
[stdout:1] 5.0

我本来希望每个引擎都打印“6.0”,就像在 IPython 教程中一样。这里,就好像没有执行归约操作一样。这可能很简单,但我不太明白我做错了什么?

我用:

  • Ubuntu 12.04
  • Python 2.7.3 32 位
  • IPython 1.1.0
  • mpi4py 1.2.2
  • mpich2
4

1 回答 1

1

如果您的引擎实际上没有使用 MPI 启动,您会看到这种行为。由于您的引擎没有 MPI 对等点,所以 allreduce 不做任何事情 - 它只是返回np.sum(a)每个引擎的值,这就是您所看到的。

检查 MPI 是否设置正确是个好主意:

%px print MPI.COMM_WORLD.Get_rank(), MPI.COMM_WORLD.Get_size()

如果您的引擎不在同一个 MPI 世界中,您的输出将如下所示:

[stdout:0] 0 1
[stdout:1] 0 1

如果他们是:

[stdout:0] 0 2
[stdout:1] 1 2

确保使用 MPI 启动引擎。例如:

ipcluster start --engines MPI

或者添加到 ipcluster_config.py:

c.IPClusterEngines.engine_launcher_class = 'MPI'

或者只是手动进行而不进行任何配置(这就是上面的所有配置):

mpiexec -n 4 ipengine
于 2013-11-23T05:42:03.400 回答