将每个 32 位条目乘以 2 的最佳方法是什么_mm256i
互相注册?
_mm256_mul_epu32
不是我正在寻找的,因为它产生 64 位输出。我想要每个 32 位输入元素都有一个 32 位结果。
而且,我确信两个 32 位值的乘法不会溢出。
Thanks!
你想要的_mm256_mullo_epi32()
固有的。来自英特尔的优秀在线内在指南 https://software.intel.com/sites/landingpage/IntrinsicsGuide/:
Synopsis
__m256i _mm256_mullo_epi32 (__m256i a, __m256i b)
#include "immintrin.h"
Instruction: vpmulld ymm, ymm, ymm CPUID Flags: AVX2
描述
将 a 和 b 中的压缩 32 位整数相乘,
产生中间 64 位整数,并存储低 32 位
dst 中的中间整数。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)