FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？

2023-11-26

我有这个程序集（AT&T 语法）：

mulsd   %xmm0, %xmm1
addsd   %xmm1, %xmm2

我想将其替换为：

vfmadd231sd %xmm0, %xmm1, %xmm2

这种转换是否总是在所有涉及的寄存器和标志中留下相同的状态？或者结果浮动会略有不同吗？（如果不同，为什么？）

（关于FMA指令：http://en.wikipedia.org/wiki/FMA_instruction_set)

不会。事实上，融合乘加的一个主要好处是它不会（必然）产生与单独的乘法和加法相同的结果。

作为一个（有点人为的）例子，假设我们有：

double a = 1 + 0x1.0p-52 // 1 + 2**-52
double b = 1 - 0x1.0p-52 // 1 - 2**-52

我们想要计算a*b - 1。 “数学上精确”的值a*b - 1 is:

(1 + 2**-52)(1 - 2**-52) - 1 = 1 + 2**-52 - 2**52 - 2**-104 - 1 = -2**-104

但如果我们首先计算a*b使用乘法它会四舍五入到 1.0，因此随后减去 1.0 会产生零结果。

如果我们使用fma(a,b,-1)相反，我们消除了乘积的中间舍入，这使我们能够得到“真实”的答案，-1.0p-104.

请注意，我们不仅得到了不同的结果，而且还设置了不同的标志；单独的乘法和减法设置不精确标志，而融合乘法加法不设置任何标志。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Assembly

floatingpoint

x86

fma

FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？的相关文章

在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
将两个 Int 值相除以获得 Float 的正确方法是什么？

我想分两份IntHaskell 中的值并获得结果Float 我尝试这样做 foo Int gt Int gt Float foo a b fromRational a b 但 GHC 版本 6 12 1 告诉我无法将预期类型 Intege
MikeOS 引导加载程序中的堆栈段

我不明白这段代码 mov ax 07C0h Set up 4K of stack space above buffer add ax 544 8k buffer 512 paragraphs 32 paragraphs loader cli
AVX-512 指令编码 - {er} 含义

在 Intel x86 指令集参考中有许多 AVX 512 指令在指令中具有可选的 er 例如 VADDPD 的一种形式定义为 EVEX NDS 512 66 0F W1 58 r VADDPD zmm1 k1 z zmm2 zmm3 m
FreePascal x64 上系统单元函数的汇编调用

我有一些 Delphi 汇编代码可以在 Win32 Win64 和 OSX 32 上编译并正常工作 XE2 但是由于我需要它在 Linux 上工作所以我一直在考虑编译它的 FPC 版本到目前为止 Win32 64 Linux32 6
在 C# 中生成随机浮点数的最佳方法[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案在 C 中生成随机浮点数的最佳方法是什么更新我想要从 float Minvalue 到 float Maxvalue 的随机浮点数我在一些
X86 预取优化：“计算 goto”线程代码

我有一个相当重要的问题我的计算图有循环和多个计算路径我没有制作一个调度程序循环其中每个顶点将被一一调用而是将所有预先分配的框架对象放置在堆中代码数据这有点类似于线程代码甚至更好 CPS 只是在堆中跳转执行代码每个代
从 std::round 转换为 int 是否安全？

我有一个问题标准圆形 http www cplusplus com reference cmath round 带签名 double round double x 假设我有这个代码 int i std round 0 9 在这种情况下 s
如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
这种没有推送寄存器的交换有多安全？

我对汇编非常陌生下面的代码应该通过两个不同的函数交换两个整数首先使用swap c然后使用swap asm 但我怀疑我是否需要push 我的意思是保存汇编代码之前寄存器的每个值和pop稍后就在返回之前 main 换句话说如果我返回
如何处理 PHP 中浮点数的奇怪舍入

众所周知浮点运算并不总是完全准确但是如何处理它的不一致之处呢 As an example in PHP 5 2 9 this doesn t happen in 5 3 echo round 14 99225 4 14 9923 ech
TSQL - 生成文字浮点值

我理解比较浮点数时遇到的许多问题并对它们在这种情况下的使用感到遗憾但我不是表格作者只有一个小障碍需要克服有人决定使用浮点数就像您期望使用 GUID 一样我需要检索具有特定浮点值的所有记录 sp help MyTable Colu
gdb查找行号的内存地址

假设我已将 gdb 附加到一个进程并且在其内存布局中有一个文件和行号我想要其内存地址如何获取文件x中第n行的内存地址这是在 Linux x86 上 gdb info line test c 56 Line 56 of test c
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
NASM 中的 equ 和 db 有什么区别？

len equ 2 len db 2 它们是否相同产生可以用来代替的标签2 如果不是那么每种申报表的优点或缺点是什么它们可以互换使用吗第一个是equate 与 C 类似 define len 2 因为它实际上并没有在最终代码中分配任
32 位到 64 位内联汇编移植

我有一段 C 代码在 GNU Linux 环境下用 g 编译它加载一个函数指针它如何执行并不重要使用一些内联汇编将一些参数推送到堆栈上然后调用该函数代码如下 unsigned long stack 1 23 33 43 save
整数溢出问题

我不断遇到整数溢出问题我不知道如何解决它有人可以帮忙吗 edx 包含 181 eax 包含 174 xor eax edx mov edx 2 div edx 假设你谈论的是x86 div edx这实际上没有意义 32位div将edx
无法识别的仿真模式：MinGW32 上的 elf_i386

我正在尝试制作内核但无法链接C与程序集一起输出这ld 我收到错误无法识别的仿真模式 elf i386 我正在使用 Windows 10 专业版以及 MinGW32 和 MSYS 我正在使用的代码 link ld link ld OUT
将字段中的位扩展到掩码中所有（重叠+相邻）集位的最快方法？

假设我有 2 个名为 IN 和 MASK 的二进制输入实际字段大小可能是 32 到 256 位具体取决于用于完成任务的指令集每次调用时两个输入都会改变 Inputs IN 1100010010010100 MASK 000111101
使用 MacLaurin 展开的 Fortran Sine 函数的微小差异

我正在用 Fortran 创建一个程序它接受以弧度表示的 sin x 的 x 然后是要计算的项数这是我的程序 Sine value using MacLaurin series program SineApprox implicit n

随机推荐

尝试在 SignalR ASP.NET Core 3.0 中使用 IAsyncEnumerable Catch

尝试从 ASP NET Core 3 SignalR Hub 捕获顶级异常这很棘手因为我使用的是yield return 并且您不能将其包装在try catch 块中它给出了这个编译器错误 CS1626 C 无法在带有 catch 子
在 Python if 或 if/elif 语句末尾包含 else: pass 语句是最佳实践吗？

如果我写 if a b do something elif a c do something else 我只是想通过否则最后是否需要写出以下内容 else pass 它似乎运行良好没有else 口译员中的声明是否有一个我不知道的原因
即使标头状态代码为 200，Retrofit 也会调用 failure() 方法

我正在使用改造进行后端通信下面是改造调用的片段 serverObject createEvent Utils getAuthHeader params new Callback
显示 Angular-loading-bar 并禁用页面的所有内容，直到页面加载

我有很多 ASP NET 页面和服务器数据库连接当从服务器向客户端发出请求时它们需要一些时间才能完全加载现在我想显示一个角度加载栏直到页面加载它工作正常但我想在加载页面时禁用该页面请参阅我使用的这个链接角度加载杆示例链接请帮
iOS 更新后保留旧的启动屏幕和应用程序图标

我有一个应用程序最近替换了启动图像和应用程序图标我从项目中的各个位置删除了所有旧资产当我通过在 Xcode 中构建将应用程序从旧版本升级到新版本时一切都很好但是如果我安装了旧版本的应用程序然后从 TestFlight 升级它
在 Pandas 计算中处理除零

我有以下数据 a pd Series 1 2 3 b pd Series 0 0 0 如果有被零除的情况我想在某些情况下将结果设置为系列之一将结果设置为特定值但以下给出了意外结果 a div b fill value 0 0 i
仅在页面加载时禁用 CSS 转换

我有一个 div 样式为悬停时背景颜色平滑过渡该div显示在许多页面包括主页中但在主页中它具有不同的背景颜色 div border 1px solid background color fff display inline bloc
来自守护程序的错误响应：hcssshim::CreateComputeSystem：无法启动虚拟机，因为未安装所需的功能

我已将 Docker Desktop 下载到 Windows 10 Pro 计算机 1809 上我正在尝试做一个docker run hello world命令但我收到此错误 docker Error response from dae
您如何管理项目依赖项（库）的许可证？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我想知道是否Nexus 存储库管理器包括像 Artifactory 这样的许可证管理器带有此插件 http wiki jfrog org conf
Android 通用应用程序方法

我想开发一个通用应用程序我是这种方法的新手这意味着平板电脑和手机应用程序都需要一个 apk 我曾经经历过支持库碎片我的目标是在单个 APk 内为平板电脑和手机构建不同的 UI 我读过让您的应用程序为 Jelly Bean 和 Ne
如何在R中使用ggplot2制作的图的y轴刻度中准确显示数字的SI前缀？

我有以下图使用此代码生成 plt lt ggplot d2 aes string x names same df 1 y value geom point aes color variable size 1 theme bw theme
Outlook 自动清理我的换行符并搞乱我的电子邮件格式

我正在使用 dotnet 框架发送电子邮件这是我用来创建消息的模板 Date of Hire HireDate Annual Salary AnnualIncome Reason for Request ReasonForRequest
使用 Kotlin Gradle DSL 向 Kotlin 项目添加集成测试

我想向 Kotlin 项目添加一个额外的源集其中将包含集成测试我看过一些帖子讨论如何为普通 Java 项目或 Kotlin 执行此操作但使用 Groovy 而不是 Kotlin Gradle DSL 总之使用 Kotlin Gr
在 C# Winforms 中的 DataGridViewCell 内绘制实心圆形或矩形

我想在圆的中心画一个小实心圆DataGridViewCell 矩形也能达到这个目的我想我必须在 CellPainting 事件中执行此操作我已经尝试过这个 if e RowIndex gt 0 e ColumnIndex gt 0 if
使用fractionDigits 对 BigDecimal 进行 JAXB 编组

所以这是我的问题我收到了一个 XSD 我生成的 XML 文件应符合该 XSD 使用org apache cxf cxf xjc pluginmaven 插件和外部绑定文件我生成源代码但是当我尝试编组我的对象时生成的 XML 不满足我的
为什么我在 mdi 子窗口上有额外的关闭按钮？

我遇到了一个奇怪的问题我的 mdi 子窗体有 2 个关闭按钮和 2 个最大化按钮问题截图我像这样创建 mdi 子项 summaryForm MdiParent ContainerForm summaryForm WindowState
声明 CSS 规则仅适用于特定类

我有以下 CSS 我需要仅应用于特定的 div 因为存在冲突相关 div 的类名称为 datepicker days 我是否声明以下内容table as datepicker days table 但是我该如何声明 table下面的类 C
我可以明确检查取消/终止异步计算吗？

我有一个如下所示的异步计算请参阅内联注释 async do Async Sleep 100 cancellation may happen during sleep but isn t checked at the end of the
将 PropertyPlaceholderConfigurer 与列表结合使用

我正在使用 PropertyPlaceholderConfigurer 从属性文件映射字符串值它工作正常我的问题是我是否可以在我的属性文件中设置以下内容我的列表 A B C 然后将其映射到列表 Value myList private
FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？

我有这个程序集 AT T 语法 mulsd xmm0 xmm1 addsd xmm1 xmm2 我想将其替换为 vfmadd231sd xmm0 xmm1 xmm2 这种转换是否总是在所有涉及的寄存器和标志中留下相同的状态或者结果浮动会略

FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？

FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？ 的相关文章

随机推荐

热门标签

FMA（融合乘加）指令是否始终产生与先乘后加指令相同的结果？的相关文章