0

我在nvidia-docker 存储库中经历了 3 个 关于这个确切问题的不同问题,但实际上无法弄清楚出了什么问题。

我是一个重度 docker 用户,但我不太了解这些问题中使用的术语和解决方案。

当我nvidia-smi以 sudo 或不以 sudo 运行时,一切正常,我得到标准输出。我的 nvidia-docker-plugin 已启动并正在运行,运行时会收到以下消息nvidia-docker run --rm nvidia/cuda nvidia-smi

英伟达码头插件| 2017/11/04 09:14:18 收到卷“nvidia_driver_387.22”的挂载请求 Blockquote nvidia-docker-plugin | 2017/11/04 09:14:18 收到卷“nvidia_driver_387.22”的卸载请求

我还尝试运行deepo存储库,但由于我的所有容器在启动时退出,因此无法使其工作,并且nvidia-docker run --rm nvidia/cuda nvidia-smi输出错误:

container_linux.go:247:启动容器进程导致“exec:\”nvidia-smi\”:在 $PATH 中找不到可执行文件”/usr/bin/docker-current:来自守护进程的错误响应:oci 运行时错误:container_linux.go :247:启动容器进程导致“exec:\”nvidia-smi\“:$PATH 中找不到可执行文件”。

我究竟做错了什么?

我运行 Fedora 26,如果它有什么不同的话

4

2 回答 2

0

在 Ubuntu 上,您应该安装nvidia-modprobe软件包。我知道这也存在于 Fedora 中。出于某种原因,这种依赖关系也不需要记录。

于 2017-11-09T03:58:14.937 回答
0

我刚刚解决了这个问题。

删除与nvidia-docker-plugin解决问题相关的卷。

对于未来的读者,只需读出您的日志消息nvidia-docker-plugin,查找挂载/卸载日志行,然后使用以下命令删除卷

docker volume rm -f <volume_to_remove>其中 volume_to_remove 应该类似于nvidia_driver_387.22(与我的情况相匹配)

似乎问题是在nvidia-smi创建卷时进行到调用的映射以及删除和重新附加卷解决了这个问题

于 2017-11-09T13:46:35.523 回答