是否有任何示例/文档显示如何在多机和多 GPU 环境中实现 skflow(tf.contrib.learn)?
我想在多机器和多 GPU 环境中使用 skflow(tf.contrib.learn)实现KMeansClustring 。我应该如何进行?
是否有任何示例/文档显示如何在多机和多 GPU 环境中实现 skflow(tf.contrib.learn)?
我想在多机器和多 GPU 环境中使用 skflow(tf.contrib.learn)实现KMeansClustring 。我应该如何进行?
理想情况下,您将运行集群管理器(Kubernetes、Mesos),否则设置多机训练相当困难。
有关核心 TensorFlow 示例,请参见此处(在 docker/kubernetes 目录下): https ://github.com/tensorflow/ecosystem
我们将很快更新那里的示例以同时使用 Estimator 和多 GPU 设置。