c++ - 内核启动指定流，但使用默认共享内存大小

Question

我需要为 CUDA 中的内核启动指定流。内核使用一些共享内存，其大小在内核代码中定义。

static const int cBlockSize = 256;

__global__ fooKernel(void* param)
{
    __shared__ uint32_t words[cBlockSize/16];
    // implementation follows, using 2 bits of shared memory per thread
}

但是，共享内存大小参数位于内核启动表达式中的流参数之前。那么如何告诉 CUDA 使用内核代码指定的共享内存大小而忽略启动代码中的内容呢？

fooKernel<<<N/cBlockSize, cBlockSize, /* What to put here? */, stream>>>(param);

显然，我想避免代码重复(cBlockSize/16)*sizeof(uint32_t)再次放在那里。实际上，表达式更复杂。

score 3 · Accepted Answer

在许多方面，静态分配和动态分配的共享内存是分开处理的。

如果您不打算使用动态分配的共享内存，则将默认值零作为第三个内核启动参数传递是安全的，无论您可能有任何使用静态分配的共享内存的意图。

c++ - 内核启动指定流，但使用默认共享内存大小

1 回答 1

Related

Reference