graphics - GPU 截锥体剔除：为什么使用扫描？

翻译自：https://stackoverflow.com/questions/63891807 2020-09-14T21:04:03.300

422 次

我正在尝试在 gpu 中实现截锥剔除。在阅读了一些内容并偶然发现了这个非常有用的存储库：https ://github.com/ellioman/Indirect-Rendering-With-Compute-Shaders之后，我注意到 goto 实现似乎是

但我想知道：为什么要使用扫描及其所有复杂性，而不仅仅是将通过 bbox 测试的对象的矩阵直接附加到附加缓冲区中？我的猜测是 appendbuffer 访问速度很慢，但它们是否比在 gpu 上运行扫描慢（如果输入数组大于每组的最大线程数，则可能需要 2 个调度调用）。

谢谢！

编辑：我是团结一致的，但我认为这个问题并不重要。

0 回答 0