我正在使用谷歌云提供的预构建深度学习 VM 实例,并连接了 Nvidia tesla K80 GPU。我选择自动安装 Tensorflow 2.5 和 CUDA 11.0。当我启动实例时,一切正常 - 我可以运行:
Import tensorflow as tf
tf.config.list_physical_devices()
我的函数返回 CPU、加速 CPU 和 GPU。同样,如果我运行tf.test.is_gpu_available()
,该函数返回 True。
但是,如果我注销,停止实例,然后重新启动实例,运行相同的确切代码只会看到 CPU 并tf.test.is_gpu_available()
导致 False。我收到一个看起来像驱动程序初始化失败的错误:
E tensorflow/stream_executor/cuda/cuda_driver.cc:355] failed call to cuInit: CUDA_ERROR_UNKNOWN: unknown error
运行nvidia-smi显示电脑还是能看到GPU,但是我的tensorflow看不到。
有谁知道这可能是什么原因造成的?我不想在重新启动实例时重新安装所有内容。