我正在查看 AVX-512 中的指令集,注意到一组fixup
指示。一些examples:
_mm512_fixupimm_pd,
_mm512_mask_fixupimm_pd,
_mm512_maskz_fixupimm_pd
_mm512_fixupimm_round_pd,
_mm512_mask_fixupimm_round_pd,
_mm512_maskz_fixupimm_round_pd
这里的“修复”是什么意思?
这是一个很好的问题。英特尔的答案(我的粗体)在这里:
本说明专门用于修复
涉及一个来源的算术计算结果,以便它们
符合规范,尽管它通常用于修复
反映特殊编号的多指令序列的结果
输入。例如,考虑 rcp(0)。在rcp中输入0,你应该
根据DX10规范获取INF。但是,通过评估 rcp
Newton-Raphson,其中 x=approx(1/0),会产生不正确的结果。到
处理这个问题,可以在N-R倒数之后使用VFIXUPIMMPS
将结果设置为正确值的序列(即 INF 当
输入为0)。
在以下位置查找 VFIXUPIMMPD:
https://software.intel.com/sites/default/files/management/0d/53/319433-022.pdf
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)