我看过一些关于 MCTS 和 GPU 的讨论。据说使用 GPU 没有优势,因为它没有很多矩阵乘法。但是使用 CPU 确实有一个缺点,因为设备之间的数据传输确实需要时间。这里我的意思是节点和树应该在 GPU 上。然后他们可以在 GPU 上处理数据,而无需从 CPU 复制数据。如果我只是创建类节点和树,他们会让他们的方法在 CPU 上工作。所以我想知道我是否可以将搜索部分移动到 GPU。有什么例子吗?
我看过一些关于 MCTS 和 GPU 的讨论。据说使用 GPU 没有优势,因为它没有很多矩阵乘法。但是使用 CPU 确实有一个缺点,因为设备之间的数据传输确实需要时间。这里我的意思是节点和树应该在 GPU 上。然后他们可以在 GPU 上处理数据,而无需从 CPU 复制数据。如果我只是创建类节点和树,他们会让他们的方法在 CPU 上工作。所以我想知道我是否可以将搜索部分移动到 GPU。有什么例子吗?