Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
在 Kepler 3.5 GPU 的同一个流式多处理器上,是否可以使用流来拥有多个独特的内核?<<<1,1024>>>即在具有 15 个 SM 的 Kepler GPU 上同时运行 30 个大小的内核?
<<<1,1024>>>
在计算能力 3.5 的设备上,这可能是可能的。
这些设备支持每个 GPU 最多 32 个并发内核和 2048 个线程对等多处理器。每个多处理器有 64k 个寄存器,如果每个线程的寄存器占用少于 16 个,并且每个块的共享内存少于 24kb,则两个 1024 个线程块可以同时运行。
您可以在 CUDA 编程指南的附录中找到所有这些硬件描述。