1

我正在运行一个需要数百个虚拟机的大型集群进程,但我的进程是容错的,因此我可以使用抢占式虚拟机。但是,在被抢占后重新启动进程需要花费几分钟的时间,所以我想选择最不忙/最不可能抢占我的虚拟机的谷歌服务器和区域。

有没有办法告诉哪个服务器最不忙或谷歌的哪些服务器使用最少?

参考:

我读了整本书,但没有帮助。我不太关心延迟,而是我的进程重新启动,它会浪费时间重新启动:https ://cloud.google.com/solutions/best-practices-compute-engine-region-selection

抢占式虚拟机谷歌文档:https ://cloud.google.com/compute/docs/instances/preemptible

谷歌区域: https ://cloud.google.com/compute/docs/regions-zones/

4

1 回答 1

2

目前没有谷歌云活动地图,但这应该是一个很好的功能来请求[1]

正如您可能知道并在 Preemptible 文档[2]中提到的那样,这些机器类型可持续长达 24 小时。由于您使用大量可抢占式虚拟机,如果 Compute Engine 需要访问这些资源,它可能会随时终止这些实例,我可以理解其影响。

您是否尝试将集群分布在同一区域的所有区域中?就像 us-central1 有 4 个不同的区域一样,您应该尝试将您的实例分布在这 4 个区域上以降低影响。(一个主意)

于 2019-09-07T16:07:49.817 回答