我知道光线在一个头节点(用户工作的计算机)和许多工作节点(其他计算机)中的基本用法。这可以通过为最新的 ray 0.8 填充 yaml 文件来完成。
但是,现在假设我有三台独立的机器,每台机器都有独立的ip、用户名和密码。我想连接其中一个并将其用作头节点,另外两个用作工作节点。但是我找不到任何关于射线文档的说明。
有谁知道如何在射线上进行这项工作?
我知道光线在一个头节点(用户工作的计算机)和许多工作节点(其他计算机)中的基本用法。这可以通过为最新的 ray 0.8 填充 yaml 文件来完成。
但是,现在假设我有三台独立的机器,每台机器都有独立的ip、用户名和密码。我想连接其中一个并将其用作头节点,另外两个用作工作节点。但是我找不到任何关于射线文档的说明。
有谁知道如何在射线上进行这项工作?
此处描述了如何在已设置 IP 和用户名的不同机器上使用 Ray:
https://ray.readthedocs.io/en/latest/using-ray-on-a-cluster.html
所以基本上你需要ray start
在所有节点上运行,节点应该是头节点还是工作节点,具有不同的参数。
在这种情况下也可以使用 Ray 自动缩放器,此处描述了如何执行此操作:https ://ray.readthedocs.io/en/latest/autoscaling.html#quick-start-private-cluster
如果您有更多问题,请告诉我们!