我是 Docker 新手,尤其是 Nvidia-Docker。我正在尝试将我的代码包装到 docker 容器中并在某些主机上运行它。但显然出了点问题,我无法在 docker 中运行我的代码。我已经安装了 Nvidia-docker 并且 Dockerfile 是从这里获取的。这是我的完整码头代码
FROM nvidia/cuda:9.1-runtime-ubuntu16.04
RUN apt-get update && apt-get install -y \
cuda-command-line-tools-$CUDA_PKG_VERSION \
cuda-libraries-dev-$CUDA_PKG_VERSION \
cuda-minimal-build-$CUDA_PKG_VERSION \
&& \
rm -rf /var/lib/apt/lists/*
ENV LIBRARY_PATH /usr/local/cuda/lib64/stubs
FROM python:3.7-slim
RUN pip install numpy
RUN apt update && \
apt-get -y install gcc && \
apt-get -y install g++
ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
ADD helmsolver /helmsolver
CMD dpkg -l | grep -i cuda
CMD cd helmsolver && bash tests.sh
还有一个 bash 脚本代码,其中 cudahelmf 和 cudahelmd 以前由
nvcc helm3dcudafnd.cu -o cudahelm -I/usr/local/cuda/samples/common/inc/ -lcufft -lcufftw -D DOUBLE
#!/bin/sh
mkdir helmholtz
cd helmholtz
mkdir build
mkdir workdir
mkdir src
mkdir scripts
ls
cp ../cudahelmf ./build
cp ../cudahelmd ./build
cp ../tmp.py ./scripts/
cd workdir
python3 ../scripts/script1.py 21 21 1
../build/cudahelmd config.cfg >> results_double.txt
../build/cudahelmf config.cfg >> results_float.txt
要构建和运行 docker 我使用
nvidia-docker build -t helm .
nvidia-docker run --rm -ti helm
运行后我有错误
../build/cudahelmd: error while loading shared libraries: libcufft.so.9.1: cannot open shared object file: No such file or directory
我究竟做错了什么?是否因为 -lcufft 编译选项而发生,并且 docker 不知道从哪里获得它?并且 docker 安装后没有 /usr/local/cuda/ 目录。由于 cuda-libraries-dev 包含 cufft 库并且安装成功结束,这似乎很奇怪。
这是我计算机上的 nvcc 版本,其中代码已编译和先前测试过。
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85
和 nvidia-docker 版本
Docker version 19.03.3, build a872fc2f86
PS也许有一个选项可以在docker中编译代码?