5

我目前正在使用 Docker 19.03 和 Kubernetes 1.13.5 和 Rancher 2.2.4。从 19.03 开始​​,Docker 已经正式支持原生 NVIDIA GPU,只需通过--gpus选项即可。示例(来自NVIDIA/nvidia-docker github):

 docker run --gpus all nvidia/cuda nvidia-smi

但在 Kubernetes 中,没有传递 Docker CLI 选项的选项。所以如果我需要运行一个GPU实例,我必须安装nvidia-docker2,使用起来不方便。

无论如何要通过 Docker CLI 选项或通过 NVIDIA 运行时而不安装nvidia-docker2

4

1 回答 1

3

GPU通过Kubernetes 中的设备插件进行调度。

官方 NVIDIA GPU 设备插件有以下要求:

  • Kubernetes 节点必须预先安装 NVIDIA 驱动程序。
  • Kubernetes 节点必须预装nvidia-docker 2.0
  • nvidia-container-runtime 必须配置为docker 而不是 runc的默认运行时。
  • NVIDIA 驱动程序 ~= 361.93

设置节点后,GPU 将成为您规范中的另一个资源,例如cpumemory.

spec:
  containers:
  - name: gpu-thing
    image: whatever
    resources:
      limits:
        nvidia.com/gpu: 1
于 2019-08-06T09:11:19.463 回答