您能给出 AVX2 中可用的条件指令列表吗?
到目前为止,我发现了以下内容:
-
_mm256_blendv_
* 可供选择a
and b
基于掩码c
是否有条件乘法和条件加法等?
另外,如果接受指示imm8
计数(比如_mm256_blend_
*),你能解释一下如何得到它吗imm8
向量比较后?
Intel Intrinsics Guide 建议使用掩码进行收集、加载和存储操作。 Blend_epi16 中的立即数 imm8 不可编程,除非考虑使用自修改代码或跳转表。仍然可以使用 BMI2 中的 pext 来压缩 movemask 结果中奇数位置位的一半——从 AVX2 中的 movemask 中获得 32 个独立的掩码位,但 Blend_epi16 使用每一位来控制 4 个字节——或一个 16 位每个银行都有变量。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)