pytorch - Pytorch 中的 Gloo 用于 GPU 张量集体通信

翻译自：https://stackoverflow.com/questions/69578471 2021-10-14T23:40:35.933

19 次

对于 Pytorch 中的 Gloo 分布式，如本文档https://pytorch.org/docs/stable/distributed.html所示，以下代码是否会获得使用 CUDA-aware MPI 的性能优势？（例如，绕过 CPU 通过 PCIe 进行 GPU 到 GPU 传输）

group = dist.new_group([0, 1], backend="gloo")
dist.all_reduce(gpu_tensor_a, op=dist.ReduceOp.SUM, group=group)

0 回答 0