“nvidia-titan”的相关标签问题

0 投票

2 回答

2743 浏览

nvidia - Titan Z 与 K40 处理器？

我正在使用 GPU 进行科学计算。最近 Nvidia 发布了其旗舰产品 GeForce Titan Z。我想知道这款处理器如何与 Tesla K40（另一个 NVIDIA 产品）相抗衡。我已经检查了规格，但很想知道这两个处理器之间的任何基准测试，或者 Titan Z 用于科学计算应用程序的能力。我还想知道从编程的角度来看，Titan Z 应该被视为单个 GPU 还是两个 GPU。

提前致谢，问候， Sakthi K

0 投票

1 回答

288 浏览

c++ - cl::Image3D segfaults on nVidia TITAN black 但不是 Intel openCL 设备？

所有，我有以下代码行用于在 OpenCL 中设置 3D 图像：

当我使用 Intel OpenCL CPU 驱动程序时，代码运行良好（通过使用 CL_DEVICE_TYPE_CPU 创建上下文），但是当我使用带有 TITAN black 的 nVidia 驱动程序时（通过使用 CL_DEVICE_TYPE_GPU 创建上下文），代码运行良好。

所有这些都在 RHEL6.4 上，内核为 2.6.32-358，使用最新的 nVidia 驱动程序，使用英特尔 OpenCL 运行时 14.1_x64_4.4.0.118 和 2014_4.4.0.134_x64 英特尔 OpenCL SDK。

所有其他代码似乎都在 nVidia 设备上运行。我可以编译内核、创建上下文、缓冲区等，但是这个构造函数似乎失败了。我使用 cl::Device::getInfo 检查了 Image3D 允许的最大尺寸，它报告 HxWxD 限制为 4096x4096x4096，因此我的 16x16x1024 图像尺寸远低于限制。

我还检查以确保 CL_R 和 CL_FLOAT 类型是受支持的格式，它们似乎是。

起初我以为它是因为试图复制主机内存而失败的，但是在我将读取的图像排入队列之前就发生了段错误。

我能够从我的 gdb 回溯中确定的最好的问题是问题出现在 CL/cl.hpp 的第 4074 行：

如您所见，Image3D 的构造函数的宽度和高度参数看起来很奇怪，但我不确定这些是真实值，也不是由于编译器而优化的值。

我的问题是：

关于 nVidia 卡，我做错了什么，不适用于 Intel CPU OpenCL 驱动程序？英特尔 SDK 和 nVidia OpenCL ICD 之间是否存在已知的二进制不兼容？

c++opencl intel nvidia-titan

0 投票

16 回答

228170 浏览

python - 如何防止 tensorflow 分配整个 GPU 内存？

我在一个计算资源共享的环境中工作，也就是说，我们有几台服务器机器，每台机器都配备了一些 Nvidia Titan X GPU。

对于中小型模型，Titan X 的 12 GB 通常足以让 2-3 人在同一个 GPU 上同时运行训练。如果模型足够小，以至于单个模型不能充分利用 GPU 的所有计算单元，那么与一个接一个地运行训练过程相比，这实际上会导致加速。即使在并发访问 GPU 确实会减慢个人训练时间的情况下，让多个用户同时在 GPU 上训练的灵活性仍然很好。

TensorFlow 的问题在于，默认情况下，它会在启动时分配全部可用的 GPU 内存。即使对于一个小型的两层神经网络，我看到所有 12 GB 的 GPU 内存都用完了。

有没有办法让 TensorFlow 只分配 4 GB 的 GPU 内存，如果知道这对于给定模型来说已经足够了吗？

python tensorflow tensorflow2.0 tensorflow2.x nvidia-titan

0 投票

1 回答

2114 浏览