python - 在 Nvidia-Docker 中运行 CUFFT 例程

Question

我是 Docker 新手，尤其是 Nvidia-Docker。我正在尝试将我的代码包装到 docker 容器中并在某些主机上运行它。但显然出了点问题，我无法在 docker 中运行我的代码。我已经安装了 Nvidia-docker 并且 Dockerfile 是从这里获取的。这是我的完整码头代码

FROM nvidia/cuda:9.1-runtime-ubuntu16.04
RUN apt-get update && apt-get install -y \
        cuda-command-line-tools-$CUDA_PKG_VERSION \
        cuda-libraries-dev-$CUDA_PKG_VERSION \
        cuda-minimal-build-$CUDA_PKG_VERSION \
&& \
    rm -rf /var/lib/apt/lists/*

ENV LIBRARY_PATH /usr/local/cuda/lib64/stubs

FROM python:3.7-slim
RUN pip install numpy
RUN apt update && \
    apt-get -y install gcc && \
    apt-get -y install g++
ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
ADD helmsolver /helmsolver
CMD dpkg -l | grep -i cuda
CMD cd helmsolver && bash tests.sh

还有一个 bash 脚本代码，其中 cudahelmf 和 cudahelmd 以前由

nvcc helm3dcudafnd.cu -o cudahelm -I/usr/local/cuda/samples/common/inc/ -lcufft -lcufftw -D DOUBLE

#!/bin/sh
mkdir helmholtz
cd helmholtz
        mkdir build
        mkdir workdir
        mkdir src
        mkdir scripts
        ls
        cp ../cudahelmf ./build
        cp ../cudahelmd ./build
        cp ../tmp.py ./scripts/
        cd workdir
        python3 ../scripts/script1.py 21 21 1
        ../build/cudahelmd config.cfg >> results_double.txt
        ../build/cudahelmf config.cfg >> results_float.txt

要构建和运行 docker 我使用

nvidia-docker build -t helm .
nvidia-docker run --rm -ti helm

运行后我有错误

../build/cudahelmd: error while loading shared libraries: libcufft.so.9.1: cannot open shared object file: No such file or directory

我究竟做错了什么？是否因为 -lcufft 编译选项而发生，并且 docker 不知道从哪里获得它？并且 docker 安装后没有 /usr/local/cuda/ 目录。由于 cuda-libraries-dev 包含 cufft 库并且安装成功结束，这似乎很奇怪。

这是我计算机上的 nvcc 版本，其中代码已编译和先前测试过。

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85

和 nvidia-docker 版本

Docker version 19.03.3, build a872fc2f86

PS也许有一个选项可以在docker中编译代码？

score 2 · Accepted Answer

问题是您正在运行一个多级 dockerfile 没有COPY从一个到另一个，因此您将仅以独立python3容器结束，容器中没有任何nvidia内容，因此您需要在python容器中复制所需的文件，如下所示：

COPY --from=0 SOURCE DEST

python - 在 Nvidia-Docker 中运行 CUFFT 例程

1 回答 1

Related

Reference