两种不同编译器配置之间可能会损失精度

2024-01-05

我目前在工作中遇到一个问题，当编译器配置从调试更改为发布时，可能会导致精度损失，而编译器配置具有不同的优化级别。由于某种原因，在我们代码的其他地方，协方差矩阵（以及类似的东西）使用了非常大的值，类似于 1e90 的值。我遇到的问题是，每当计算中存在任何形式的精度损失并且这些极大值之一仍然存在时，两者的乘积就会带来一些不稳定。我不确定为什么不使用更合理的值，但我不是编写这段代码的人，所以是的......到目前为止，我相信我已经将问题追踪到了特定位置。我在该位置拥有的确切数字如下所示：

DBL sum = 6.000000040000000400e-004; // same for debug and release configurations
const DBL dinv = 2.000000020000000300e-004; // same for debug and release configurations

请注意，DBL 是普通的双精度：

typedef double DBL;

然后，执行如下操作：

sum /= dinv;

这产生：

sum = 2.999999990000000100e+000 // (for debug configuration)<br>
sum = 2.999999989999999600e+000 // (for release configuration)

我查看了两种配置的反汇编，发现了一些差异（预计是因为优化量不同）。

- 调试 -

1D91FF73  movsd       xmm0,mmword ptr [sum]
1D91FF78  divsd       xmm0,mmword ptr [dinv]
1D91FF7D  movsd       mmword ptr [sum],xmm0

我还没有真正读过反汇编，但我的理解如下：sum被移动到xmm0，然后xmm0被dinv就地除（结果在xmm0中，因为除法是就地），然后xmm0被移动到sum 。

正如预期的那样，发布的反汇编是不同的。

- 发布 -

1D7557AB  movsd       xmm1,mmword ptr [esp+50h]  
1D7557B1  xorps       xmm0,xmm0  
1D7557B4  mulsd       xmm1,mmword ptr [esp+68h]

将 sum 赋值给 dinv 的反汇编为：

1D7B55B7  movsd       xmm1,mmword ptr [esp+68h]

我认为 dinv 是 [esp+68h] 表示的指针指向的值，sum 是 [esp+50h] 表示的指针指向的值，这是否正确？如果不是，那是什么情况？

有谁知道为什么我失去精度？目的是什么xorps?

此链接中的 x86 指令集参考可能会有所帮助：http://x86.renejeschke.de/ http://x86.renejeschke.de/

- 更新 -
正如下面提到的答案，调试配置使用 /fp:precise，发布配置使用 /fp:fast（使用 Microsoft Visual Studio 2013，要访问项目的构建配置设置，只需右键单击该项目）项目，单击属性，然后导航到 C/C++）。对我来说，这导致了 1e-15 左右的舍入误差，给出或接受一个命令。这对我来说是一个问题，因为在代码的其他地方，有些人使用了非常大的值（大约 1e90，给出或接受一个命令）。我为测试目的“破坏”调试配置所做的一件事是拆分sum /= dinv计算分为两步。首先，取倒数dinv通过计算1.0/dinv（在下面的答案中提到这是一个不好的操作），将该结果乘以sum，并将结果放入sum。我发现当我这样做时，调试和发布都表现得很差。

如果您正在使用

GCC with - 倒数数学 http://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html#index-freciprocal-math-953（直接或间接通过-funsafe-math-optimizations or -ffast-math or -Ofast)
视觉工作室和fp：浮点语义的快速模式 http://msdn.microsoft.com/en-us/library/aa289157%28VS.71%29.aspx#floapoint_topic10

编译器可以在调试模式下生成标准除法指令：

1D91FF78  divsd       xmm0,mmword ptr [dinv]

或释放模式下的“除以乘法逆元”：

1D7557B4  mulsd       xmm1,mmword ptr [esp+68h]

从数学上来说

a / b = a * (1 / b)

但在现实世界中，乘以倒数总是会引入更多错误，并且不允许编译器执行此优化，因为结果会不同且不符合要求（wrt IEEE-754）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

两种不同编译器配置之间可能会损失精度的相关文章

是否需要销毁运算符删除的形式才能真正销毁对象？

C 20 添加了破坏形式operator delete区别于std destroying delete t范围它导致delete表达式在调用之前不再销毁对象operator delete 目的是在显式调用对象的析构函数和释放内存之前允许
是否可以使用 http url 作为 DirectShow .Net 中源过滤器的源位置？

我正在使用 DirectShow Net 库创建一个过滤器图该过滤器图通过使用 http 地址和 WM Asf Writer 来流式传输视频然后在网页上我可以使用对象元素在 Windows Media Player 对象中呈现视频源
关于逻辑/算法的想法以及如何防止线程写入 Sql Server 中的竞争

我有以下逻辑 public void InQueueTable DataTable Table int incomingRows Table Rows Count if incomingRows gt RowsThreshold async
2个对象，完全相同（除了命名空间）c#

我正在使用第三方的一组网络服务但遇到了一个小障碍在我手动创建将每个属性从源复制到目标的方法之前我想我应该在这里寻求更好的解决方案我有 2 个对象一个是 Customer CustomerParty 类型另一个是 Appointm
使用 C# 和 ASP.NET 在电子邮件附件中发送 SQL 报告

我正在尝试使用 ASP NET 和 C 从 sql reportserver 2008 作为电子邮件附件发送报告到目前为止我学会了如何获取 PDF 格式的报告 http weblogs asp net srkirkland archive
MVC 5 中具有 ASP.NET Identity 的 Autofac 不会验证 OWIN 管道中的安全标记

我在 MVC 5 中设置了 AutoFac 来与 ASP NET Identity 一起使用表面上一切似乎都工作正常即用户可以创建帐户并登录但后来我发现当安全标记更改时用户不会注销通过在 AspNetUsers 表中进行暴力破解
用于在标头更改时重新编译的简单 C 项目的示例 makefile

有谁有完整的 makefile 可以执行以下操作如果 HEADER 文件发生更改则重建项目 cpp 文件在 makefile 中列出头文件未在 makefile 中列出头文件允许与 cpp 文件具有不同的名称部分cpp文件没有头文
if constexpr 中的 not-constexpr 变量 – clang 与 GCC

struct A constexpr operator bool const return true int main auto f auto v if constexpr v A a f a clang 6 接受该代码 GCC 8 拒绝它
JavaScript 错误：MVC2 视图中的条件编译已关闭

我试图在 MVC2 视图页面中单击时调用 JavaScript 函数 a href Select a JavaScript 函数 function SelectBenefit id code alert id alert code 这里 b
C# 根据当前日期传递日期时间值

我正在尝试根据 sql server 中的两个日期获取记录 Select from table where CreatedDate between StartDate and EndDate我通过了5 12 2010 and 5 12 20
Libev，如何将参数传递给相关回调

我陷入了 libev 中争论的境地通常 libev 在类似的函数中接收包接收回调没关系但是实际操作中我们需要派遣一个亲戚写回调根据收到的包裹处理具体工作例如 S RECV MSG pstRecvMsg S RECV MSG
测量进程消耗的 CPU 时钟

我用 C 语言编写了一个程序它是作为研究结果创建的程序我想计算程序消耗的确切 CPU 周期精确的循环次数知道我怎样才能找到它吗 The valgrind tool cachegrind valgrind tool cachegrin
如何在 Javascript 中连接 C# ActiveX 事件处理程序

我尝试使用几个代码片段将 ActiveX 对象与 Javascript 事件处理程序挂钩我无法确定为什么事件处理程序没有被调用带有项目的 Github 存储库 https github com JesseKPhillips Csharp
在 azure blob 存储中就地创建 zip 文件

我将文件存储在 Blob 存储帐户内的一个容器中我需要在第二个容器中创建一个 zip 文件其中包含第一个容器中的文件我有一个使用辅助角色和 DotNetZip 工作的解决方案但由于 zip 文件的大小最终可能达到 1GB 我担心在进
SQLAPI++ 的免费替代品？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何免费也许是开源的替代品SQLAPI http www sqlapi com 这个库看起来
ASP.NET Core 中间件与过滤器

在阅读了 ASP NET Core 中间件之后我对何时应该使用过滤器以及何时应该使用中间件感到困惑因为它们似乎实现了相同的目标什么时候应该使用中间件而不是过滤器 9频道有一个关于此的视频 ASP NET 怪物 91 中间件与过滤器 h
Unity3D - 将 UI 对象移动到屏幕中心，同时保持其父子关系

我有一个 UI 图像它的父级是 RectTransform 容器该容器的父级是 UI 面板而 UI 面板的父级是 Canvas 我希望能够将此 UI 图像移动到屏幕中心即画布同时保留父级层次结构我的目标是将 UI 图像从中心动画
如何从 Windows Phone 7 模拟器获取数据

我有一个 WP7 的单元测试框架它在手机上运行结果相当难以阅读因此我将它们写入 XDocument 我的问题是如何才能将这个 XML 文件从手机上移到我的桌面上以便我可以实际分析结果到目前为止我所做的是将 Debugger B
任何人都可以清楚地告诉如何在不使用像这样的预定义函数的情况下找到带有小数值或小数值的指数吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案例如 2 0 5 1 414 所以想要我是 c 的新手所以请解释简单的逻辑如果不是复杂的逻辑也足够了在数学中从整数取幂到实数
如何在 ASP.NET Core 中注入泛型的依赖关系

我有以下存储库类 public class TestRepository Repository

随机推荐

Stack<> 构造函数在从其他构造函数初始化时是否会反转堆栈？

这是代码 var s new Stack
Fluent Nhibernate - 如何指定表名

我刚刚开始学习 Nhibernate 和 Fluent Nhibernate 我想在创建映射类时指定表名称应用程序中的实体名称是 CustomerOrders 但在oracle数据库中表名称是 CUSTOMER ORDERS 我从谷歌搜
MySQL - 如何快速插入百万行？ [复制]

这个问题在这里已经有答案了因此出于开发目的我需要一个包含大约 100 万到 1 亿个值的表我当前的方法一点也不快开发人员通常会做什么来让他们的表拥有数百万行来测试他们的程序处理这些数据的速度我当前的方法有 10 个 for 循环
让 jStorage 正常工作

所以我认为jStorage是我需要解决我的问题之一它需要 JSON 才能与 jQuery 一起使用所以我尝试过包含它但它似乎不起作用我不知道 JSON 实际上是什么这是我的代码 jQuery 加载得更高它甚至不显示警报窗口
Linux 内核：为什么“子类”结构将基类信息放在末尾？

我正在阅读中的章节美丽的代码 http shop oreilly com product 9780596510046 do关于 Linux 内核作者讨论了 Linux 内核如何在 C 语言中实现继承以及其他主题简而言之定义了一个基
为什么 (?!^) 等价于 (?

不久前我回答过这个问题 https stackoverflow com questions 6448461 regexp split a string by its middle character matches就这样但我仍然不明白为什

FileReader 与 window.URL.createObjectURL

我正在构建一个移动网站我想使用相机 API 来拍照图像应显示在网站上并上传到服务器根据MDN 上的 Camera API 介绍 https developer mozilla org en US docs Web Guide API
只看到该组件的一半字母 - cn1

我使用了粗体 ttf 字体它可以工作但只能看到一半的字母 Code public void start if current null current show return Label testLabel new Label Bold
Microsoft.Web.Administration.ServerManager 正在连接到 IIS Express 而不是完整的 IIS

我用它来创建一个实例ServerManager Void Reflection Assembly LoadWithPartialName Microsoft Web Administration serverManager New Obje
CORS：对预检请求的响应未通过访问控制检查

对预检请求的响应未通过访问控制检查 XMLHttpRequest 无法加载http localhost 49531 访问身份验证 http localhost 49531 Access Authenticate 对预检请求的响应未通过访问
使用 Python-pptx 居中对齐文本

简而言之问题 Python pptx 中是否可以将文本居中对齐自从我使用 Python pptx 以来我已经能够自动化很多事情而且我真的很喜欢使用它但是我遇到了问题我正在尝试将文本在幻灯片上水平居中如果你不明白我的意思我的文
尝试调用类方法的代码中的各种错误[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我有这个代码 class SomeClass classmethod def func1 cls arg1 Do Som
使用 Jackson 将带下划线的 JSON 反序列化为 Java 中的驼峰式大小写？ [复制]

这个问题在这里已经有答案了要将具有驼峰式大小写属性的 java 对象序列化为带下划线的 json 我们使用PropertyNamingStrategy as SNAKE CASE 那么有没有什么可以做相反的事情呢即将带有下划线的jso
将 C# 控制台应用程序作为 Windows 服务运行

我有一个基本的 C 控制台应用程序我想将其作为 Windows 服务运行我已经使用创建了 Windows 服务sc create 这工作正常我可以在下面看到我的服务services msc 当我尝试启动此服务时出现以下错误无法在本
无法在动态链接库 libstdc++-6.dll 中定位过程入口点 __gxx_personality_v0

我在尝试运行 opencv 应用程序时遇到了该错误我使用的是 Windows7 CodeBlocks 12 11 opencv2 4 4 和 MinGW 编译器 CodeBlocks 中自带的编译器它编译并创建可执行文件但当我尝试运行
在 MAMP 上使用 Python

我正在慢慢从 PHP 迁移到 Python 特别是当我在 webdev webdesign 工作时我想使用 Python 显示一个基本的 HTML 页面使用以下代码 usr bin python print This is a tes
Spring Boot Web 服务器在 Eclipse 中工作正常，但无法在服务器上启动：缺少 EmbeddedServletContainerFactory bean

遵循模型Spring文档 http projects spring io spring boot quick start我创建了一个非常简单的类似 Hello World 的应用程序它在 Eclipse 上运行正常一切看起来都很棒甜的
如何在新部署 Angular2 应用程序后刷新浏览器

因此我有几个使用 Angular 2 应用程序打开浏览器窗口的客户端然后我执行 ng build prod 并将新版本发布到服务器如何强制客户端刷新所有缓存的脚本我刚刚完成了这个问题的解决方案我尝试了几种不同的方法但最终维护了一
符号链接中的环境变量

我们可以在符号链接中使用 HOME 或其他环境变量吗我知道使用相对路径 config但有时对很多人来说就像是 config或者使用 HOME 会更舒服 Edit habbie https stackoverflow com users
两种不同编译器配置之间可能会损失精度

我目前在工作中遇到一个问题当编译器配置从调试更改为发布时可能会导致精度损失而编译器配置具有不同的优化级别由于某种原因在我们代码的其他地方协方差矩阵以及类似的东西使用了非常大的值类似于 1e90 的值我遇到的问题是每当计

两种不同编译器配置之间可能会损失精度

两种不同编译器配置之间可能会损失精度 的相关文章

随机推荐

热门标签

两种不同编译器配置之间可能会损失精度的相关文章