2

我是 Docker 新手,尤其是 Nvidia-Docker。我正在尝试将我的代码包装到 docker 容器中并在某些主机上运行它。但显然出了点问题,我无法在 docker 中运行我的代码。我已经安装了 Nvidia-docker 并且 Dockerfile 是从这里获取的。这是我的完整码头代码

FROM nvidia/cuda:9.1-runtime-ubuntu16.04
RUN apt-get update && apt-get install -y \
        cuda-command-line-tools-$CUDA_PKG_VERSION \
        cuda-libraries-dev-$CUDA_PKG_VERSION \
        cuda-minimal-build-$CUDA_PKG_VERSION \
&& \
    rm -rf /var/lib/apt/lists/*

ENV LIBRARY_PATH /usr/local/cuda/lib64/stubs

FROM python:3.7-slim
RUN pip install numpy
RUN apt update && \
    apt-get -y install gcc && \
    apt-get -y install g++
ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
ADD helmsolver /helmsolver
CMD dpkg -l | grep -i cuda
CMD cd helmsolver && bash tests.sh

还有一个 bash 脚本代码,其中 cudahelmf 和 cudahelmd 以前由

nvcc helm3dcudafnd.cu -o cudahelm -I/usr/local/cuda/samples/common/inc/ -lcufft -lcufftw -D DOUBLE
#!/bin/sh
mkdir helmholtz
cd helmholtz
        mkdir build
        mkdir workdir
        mkdir src
        mkdir scripts
        ls
        cp ../cudahelmf ./build
        cp ../cudahelmd ./build
        cp ../tmp.py ./scripts/
        cd workdir
        python3 ../scripts/script1.py 21 21 1
        ../build/cudahelmd config.cfg >> results_double.txt
        ../build/cudahelmf config.cfg >> results_float.txt

要构建和运行 docker 我使用

nvidia-docker build -t helm .
nvidia-docker run --rm -ti helm

运行后我有错误

../build/cudahelmd: error while loading shared libraries: libcufft.so.9.1: cannot open shared object file: No such file or directory

我究竟做错了什么?是否因为 -lcufft 编译选项而发生,并且 docker 不知道从哪里获得它?并且 docker 安装后没有 /usr/local/cuda/ 目录。由于 cuda-libraries-dev 包含 cufft 库并且安装成功结束,这似乎很奇怪。

这是我计算机上的 nvcc 版本,其中代码已编译和先前测试过。

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85

和 nvidia-docker 版本

Docker version 19.03.3, build a872fc2f86

PS也许有一个选项可以在docker中编译代码?

4

1 回答 1

2

问题是您正在运行一个多级 dockerfile 没有COPY从一个到另一个,因此您将仅以独立python3容器结束,容器中没有任何nvidia内容,因此您需要在python容器中复制所需的文件,如下所示:

COPY --from=0 SOURCE DEST
于 2019-10-17T05:17:05.457 回答