我有这个程序集(AT&T 语法):
mulsd %xmm0, %xmm1
addsd %xmm1, %xmm2
我想将其替换为:
vfmadd231sd %xmm0, %xmm1, %xmm2
这种转换是否总是在所有涉及的寄存器和标志中留下相同的状态?或者结果浮动会略有不同吗? (如果不同,为什么?)
(关于FMA指令:http://en.wikipedia.org/wiki/FMA_instruction_set)
不会。事实上,融合乘加的一个主要好处是它不会(必然)产生与单独的乘法和加法相同的结果。
作为一个(有点人为的)例子,假设我们有:
double a = 1 + 0x1.0p-52 // 1 + 2**-52
double b = 1 - 0x1.0p-52 // 1 - 2**-52
我们想要计算a*b - 1
。 “数学上精确”的值a*b - 1
is:
(1 + 2**-52)(1 - 2**-52) - 1 = 1 + 2**-52 - 2**52 - 2**-104 - 1 = -2**-104
但如果我们首先计算a*b
使用乘法它会四舍五入到 1.0,因此随后减去 1.0 会产生零结果。
如果我们使用fma(a,b,-1)
相反,我们消除了乘积的中间舍入,这使我们能够得到“真实”的答案,-1.0p-104
.
请注意,我们不仅得到了不同的结果,而且还设置了不同的标志;单独的乘法和减法设置不精确标志,而融合乘法加法不设置任何标志。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)