4

我正在使用 AVX 指令手动优化一些代码。在某些时候,我想使用 _mm_i32gather_ps() 从(未对齐的)数组中收集一些浮点数,因为它们位于随机位置(不连续)。

尽管如此,我没有得到我期望的值。我检查了索引(这是正确的),即使我对索引中的值进行硬编码,比如

idx = _mm256_set_epi32(100,101,102,103,104,105,106,107);
values = _mm256_i32gather_ps(array,idx,1);

我没有得到预期值。

据我所知,数组不需要对齐,也不需要对数组的访问。有谁看到我可能做错了什么?

谢谢

4

0 回答 0