0

我想为一些神经网络计算我的算法的理论加速,我想知道乘法、加法、FMA(融合乘法加法)和二元运算的性能比。我知道比率(乘法累加运算)和二进制运算(64 位)可以从这里取为 1.91 。

我想知道所有这些操作的合理比例可能在一般 CPU、GPU 上!!这个 wiki页面提到,对于 Intel Core CPU,我们有:8 SP FLOPS/cycle,4-wide SSE 加法 + 4-wide SSE 乘法。

那么我可以说加法运算和乘法运算是否需要相同的时间(单独),并且乘法累加运算是否需要与它们相同的时间?

4

0 回答 0