我正在尝试使用英特尔 FMA 内在函数,例如_mm_fmadd_ps (__m128 a, __m128 b, __m128 c),以便在我的代码中获得更好的性能。
所以,首先,我做了一个小测试程序,看看它可以做什么以及我如何使用它们。
#include <stdio.h>
#include <stdlib.h>
#include "xmmintrin.h"
int main()
{
__m128 v1,v2,v3,vr;
v1 = _mm_set_ps (5.0, 5.0, 5.0, 5.0);
v2 = _mm_set_ps (2.0, 2.0, 2.0, 2.0);
v3 = _mm_set_ps (3.0, 3.0, 3.0, 3.0);
vr = _mm_fmadd_ps (v1, v2, v3);
}
我有这个错误:
vr = 错误:从类型 'int' 分配给类型 '__m128' 时类型不兼容 vr = _mm_fmadd_ps (v1, v2, v3);
我认为可能是处理器功能不允许使用此类指令,所以我在互联网上查找了我的处理器型号(英特尔®酷睿™ i7-4700MQ 处理器),我发现它仅支持SSE4.1/4.2, AVX 2.0内在函数对我来说有点奇怪!!所以我查看了 proc/cpuinfo 文件和标志部分,我找到了 ** fma ** 标志。这是关于硬件的令人困惑的部分。
至于软件,我在互联网上进行了一些挖掘后使用了这个 makefile 选项,我希望这不是问题。
CC=gcc
CFLAGS=-g -c -Wall -O2 -mavx2 -mfma
我在 Ubuntu 12.04 LTS 上使用 Eclipse,GCC 版本 4.9.4 谢谢。