2

如果这是一个愚蠢的问题,我很抱歉,但我一直想知道为什么有这么多示例顶点着色器,其中包含模型视图矩阵。在我的程序中,我有以下情况:

  • 投影矩阵几乎不会改变(例如在调整应用程序窗口大小时)并且它是独立的,这很好,
  • 模型矩阵经常变化(例如模型上的变换),
  • 视图矩阵也经常变化(例如,改变观察方向,四处移动,...)。

如果我要在顶点着色器中使用模型视图矩阵,我必须在 CPU 上执行矩阵乘法并上传单个矩阵。另一种方法是上传模型和视图矩阵并在 GPU 上进行乘法运算。关键是,视图矩阵不一定与模型矩阵同时发生变化,但如果使用模型视图矩阵,则每当它们中的任何一个发生变化时,都必须执行 CPU 乘法和上传。为什么不使用单独的视图和模型矩阵来实现快速的 GPU 乘法并且可能大约相同数量的 GPU 矩阵上传?

4

2 回答 2

5

因为在顶点着色器中将矩阵相乘会使 GPU 对进入其中的每个顶点进行完整计算(请注意,最近的 GLSL 编译器会检测到乘积在所有顶点上是一致的,并且可能会将计算从 GPU 移到中央处理器)。

此外,在执行单个4×4 矩阵计算时,CPU 实际上胜过 GPU,因为没有数据传输和命令队列开销。

GPU 计算的一般规则是:如果它在所有顶点上是统一的,并且您可以轻松地在 CPU 上进行预计算,那么就在 CPU 上进行。

于 2014-04-25T10:49:50.983 回答
2

因为每个模型只需要计算一次 MV 矩阵。如果您将两者分别上传到 GPU,它将对每个顶点进行计算。

现在可能是,如果您受 CPU 限制,那么它仍然是性能提升,因为即使您添加(可能)1000 次额外的矩阵乘法,您也会将它们推离 CPU,但我认为这是一种优化而不是比标准技术。

于 2014-04-25T10:35:22.033 回答