如何强制 GCC 假定浮点表达式为非负？

2024-01-08

在某些情况下，您知道某个浮点表达式始终为非负数。例如，当计算向量的长度时，sqrt(a[0]*a[0] + ... + a[N-1]*a[N-1]) (NB: I am意识到std::hypot，这与问题无关），并且平方根下的表达式显然是非负的。然而，海湾合作委员会outputs https://godbolt.org/z/SsrYUu以下程序集用于sqrt(x*x):

        mulss   xmm0, xmm0
        pxor    xmm1, xmm1
        ucomiss xmm1, xmm0
        ja      .L10
        sqrtss  xmm0, xmm0
        ret
.L10:
        jmp     sqrtf

也就是说，它比较的结果x*x为零，如果结果非负，则执行sqrtss指令，否则调用sqrtf.

所以，我的问题是：我怎样才能迫使海湾合作委员会假设x*x始终为非负数，因此它会跳过比较和sqrtf调用，而不编写内联汇编？

我想强调的是，我对本地解决方案感兴趣，而不是做类似的事情-ffast-math, -fno-math-errno, or -ffinite-math-only（尽管这些确实解决了问题，感谢评论中的 ks1322、harold 和 Eric Postpischil）。

此外，“迫使海湾合作委员会假设x*x是非负的”应该解释为assert(x*x >= 0.f)，所以这也排除了以下情况x*x为 NaN。

我对特定于编译器、特定于平台、特定于 CPU 等的解决方案很满意。

你可以写assert(x*x >= 0.f)在 GNU C 中作为编译时承诺而不是运行时检查，如下所示：

#include <cmath>

float test1 (float x)
{
    float tmp = x*x;
    if (!(tmp >= 0.0f)) 
        __builtin_unreachable();    
    return std::sqrt(tmp);
}

（有关的：__builtin_unreachable 有助于哪些优化？ https://stackoverflow.com/questions/54764535/what-optimizations-does-builtin-unreachable-facilitate你也可以包裹if(!x)__builtin_unreachable()在宏中并调用它promise()或者其他的东西。）

但海湾合作委员会不知道如何利用这一承诺tmp是非 NaN 且非负。我们仍然得到（Godbolt https://godbolt.org/#g:!((g:!((g:!((h:codeEditor,i:(j:1,lang:c%2B%2B,source:%27%23include+%3Ccmath%3E%0A%0Afloat+test1+(float+x)%0A%7B%0A++++float+tmp+%3D+x*x%3B%0A++++if+(!!(tmp+%3E%3D+0.0f))+%0A++++++++__builtin_unreachable()%3B++++%0A++++return+std::sqrt(tmp)%3B%0A%7D%0A%0Afloat+test2+(float+x)%0A%7B%0A++++return+std::sqrt(x*x)%3B%0A%7D%0A%27),l:%275%27,n:%270%27,o:%27C%2B%2B+source+%231%27,t:%270%27)),k:36.64524356415925,l:%274%27,m:100,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:g92,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!((name:rangesv3,ver:%27036%27)),options:%27-fno-math-errno+-std%3Dgnu%2B%2B17+-O3%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+gcc+9.2+(Editor+%231,+Compiler+%231)+C%2B%2B%27,t:%270%27)),header:(),k:30.021423102507427,l:%274%27,m:100,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:gsnapshot,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!((name:rangesv3,ver:%27036%27)),options:%27-std%3Dgnu%2B%2B17+-O3+-fno-trapping-math%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+gcc+(trunk)+(Editor+%231,+Compiler+%232)+C%2B%2B%27,t:%270%27)),k:33.33333333333333,l:%274%27,n:%270%27,o:%27%27,s:0,t:%270%27)),l:%272%27,m:100,n:%270%27,o:%27%27,t:%270%27)),version:4) 检查的相同的固定 asm 序列x>=0并以其他方式调用sqrtf to set errno. 据推测，扩展为比较和分支是在其他优化过程之后发生的，所以编译器了解更多信息并没有帮助。

这是推测性内联逻辑中的一个错过的优化sqrt when -fmath-errno已启用（不幸的是默认情况下启用）。

你想要的是`-fno-math-errno`，这在全球范围内都是安全的

如果您不依赖数学函数设置，那么这是 100% 安全的errno。没有人想要这样，这就是 NaN 传播和/或记录屏蔽 FP 异常的粘性标志的用途。例如C99/C++11fenv https://en.cppreference.com/w/cpp/numeric/fenv通过访问#pragma STDC FENV_ACCESS ON然后像这样的函数fetestexcept() https://en.cppreference.com/w/cpp/numeric/fenv/fetestexcept。请参阅中的示例feclearexcept https://en.cppreference.com/w/cpp/numeric/fenv/feclearexcept它显示了使用它来检测除零。

FP 环境是线程上下文的一部分，而errno是全球性的。

对这个过时的错误功能的支持不是免费的；您应该将其关闭，除非您有编写使用它的旧代码。不要在新代码中使用它：使用fenv。理想情况下支持-fmath-errno会尽可能便宜，但实际使用的人很少__builtin_unreachable()或其他排除 NaN 输入的因素可能会让开发人员不值得花时间来实现优化。不过，如果您愿意，您可以报告错过优化的错误。

事实上，现实世界的 FPU 硬件确实有这些粘性标志，这些标志在清除之前一直保持设置状态，例如x86's mxcsr http://softpixel.com/%7Ecwright/programming/simd/sse.php用于 SSE/AVX 数学的状态/控制寄存器，或其他 ISA 中的硬件 FPU。在 FPU 可以检测异常的硬件上，高质量的 C++ 实现将支持诸如fetestexcept()。如果没有，那么数学-errno可能也不起作用。

errnofor math 是一个过时的设计，C / C++ 默认情况下仍然沿用它，现在被广泛认为是一个坏主意。它使编译器更难有效地内联数学函数。或者也许我们并不像我想象的那样坚持下去：为什么 errno 没有设置为 EDOM，即使 sqrt 取出域参数？ https://stackoverflow.com/questions/56243525/why-errno-is-not-set-to-edom-even-sqrt-takes-out-of-domain-arguement解释说在数学函数中设置 errno 是optional在 ISO C11 中，实现可以表明他们是否这样做。大概在 C++ 中也是如此。

结块是个大错误-fno-math-errno进行价值改变的优化，例如-ffast-math or -ffinite-math-only.您应该强烈考虑在全局启用它，或者至少对于包含此函数的整个文件启用它。

float test2 (float x)
{
    return std::sqrt(x*x);
}

# g++ -fno-math-errno -std=gnu++17 -O3
test2(float):   # and test1 is the same
        mulss   xmm0, xmm0
        sqrtss  xmm0, xmm0
        ret

你不妨使用-fno-trapping-math同样，如果您不打算使用以下方法揭露任何 FP 异常feenableexcept()。（虽然此优化不需要该选项，但它只是errno- 设置废话，这是一个问题。）。

-fno-trapping-math不假设 no-NaN 或任何东西，它只假设像 Invalid 或 Inexact 这样的 FP 异常不会实际调用信号处理程序，而不是产生 NaN 或舍入结果。-ftrapping-math是默认值，但是根据 GCC 开发者 Marc Glisse 的说法，它已经损坏并且“从未工作过” https://stackoverflow.com/questions/56670132/simd-for-float-threshold-operation#comment99952463_56681744。（即使打开了它，GCC 也会进行一些优化，这些优化可以将引发的异常数量从零更改为非零，反之亦然。并且它会阻止一些安全优化）。但不幸的是，https://gcc.gnu.org/bugzilla/show_bug.cgi?id=54192 https://gcc.gnu.org/bugzilla/show_bug.cgi?id=54192（默认关闭）仍然打开。

如果您确实曾经揭露过异常，那么最好-ftrapping-math，但同样，您很少会希望这样做，而不是在一些数学运算后检查标志或检查 NaN。而且它实际上并没有保留精确的异常语义。

See 用于浮点阈值操作的 SIMD https://stackoverflow.com/questions/56670132/simd-for-float-threshold-operation对于这样的情况-ftrapping-math默认错误地阻止了安全优化。（即使在提升潜在陷阱操作以便 C 无条件执行此操作之后，gcc 也会生成有条件执行此操作的非向量化汇编！因此，GCC 不仅会阻止向量化，而且还会更改与 C 抽象机相比的异常语义。）-fno-trapping-math实现预期的优化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何强制 GCC 假定浮点表达式为非负？的相关文章

具有子列表属性映射问题的自动映射器

我有以下型号 Models public class Dish Required public Int64 ID get set Required public string Name get set Required public str
为什么libc++的shared_ptr实现使用完整内存屏障而不是宽松内存屏障？

在boost的实现中shared ptr 它用放松内存排序以增加其引用计数 https github com boostorg smart ptr blob master include boost smart ptr detail sp
OpenCv读/写视频色差

我试图简单地使用 openCV 打开视频处理帧并将处理后的帧写入新的视频文件我的问题是即使我根本不处理帧只是打开视频使用 VideoCapture 读取帧并使用 VideoWriter 将它们写入新文件输出文件看起来比输入更绿
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
使用具有现有访问令牌的 Google API .NET 客户端

用例如下移动应用程序正在通过 Google 对用户进行身份验证并且在某些时候我们需要将用户的视频发布到他的 YouTube 帐户出于实际原因实际发布应该由后端完成已经存储在那里的大文件由于用户已经通过应用程序的身份验证因此应
C#动态支持吗？

看完之后这个帖子 https stackoverflow com questions 2674906 when should one use dynamic keyword in c sharp 4 0k和链接我还有 2 个问题问题 1
为什么大多数 C 开发人员使用 Define 而不是 const？ [复制]

这个问题在这里已经有答案了在许多程序中 define与常量具有相同的用途例如 define FIELD WIDTH 10 const int fieldWidth 10 我通常认为第一种形式优于另一种形式它依赖于预处理器来处理基本上是
POCO HTTPSClientSession 发送请求时遇到问题 - 证书验证失败

我正在尝试使用 POCO 库编写一个向服务器发出 HTTPS 请求的程序出于测试目的我正在连接到具有自签名证书的服务器并且我希望允许客户端进行连接为了允许这种情况发生我尝试安装InvalidCertificateHandler这是
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
访问者和模板化虚拟方法

在一个典型的实现中Visitor模式该类必须考虑基类的所有变体后代在许多情况下访问者中的相同方法内容应用于不同的方法在这种情况下模板化的虚拟方法是理想的选择但目前这是不允许的那么模板化方法可以用来解析父类的虚方法吗鉴于
如何识别 WPF 文本框中的 ValidationError 工具提示位置

我添加了一个箭头来指示工具提示中的文本框当文本框远离屏幕边缘时这非常有效但是当它靠近屏幕边缘时工具提示位置发生变化箭头显示在左侧 Here is the Image Correct as expected since TextBo
即使手动设置显示环境变量后，WSL Ubuntu 也会显示“错误：无法打开显示”

我在 WSL Ubuntu 上使用 g 我使用 git 克隆了 GLFW 存储库使用了ccmake命令配置并生成二进制文件然后使用make在 build 目录中最终创建 a文件我安装了所有OpenGL相关的库 usr ld 我不记得我
在非活动联合成员上使用“std::addressof”是否定义明确[重复]

这个问题在这里已经有答案了下面的代码是尝试实现constexpr的版本offsetof在 C 11 中它可以在 gcc 7 2 0 和 clang 5 0 0 中编译这取决于申请std addressof工会非活跃成员的成员这是明确
无法将类型“System.IO.Stream”隐式转换为“Java.IO.InputStream”

我提到了一些类似的问题但没有一个涉及IO 当我使用时我在java中使用了相同的代码Eclipse 那次就成功了但现在我尝试在中使用这段代码Mono for Android C 它不起作用我正在尝试运行此代码来创建一个InputStr
将构建日期放入“关于”框中

我有一个带有关于框的 C WinForms 应用程序我使用以下方法将版本号放入关于框中 FileVersionInfo GetVersionInfo Assembly GetExecutingAssembly Location F
尚未处理时调用 Form 的 Invoke 时出现 ObjectDisposeException

我们得到一个ObjectDisposedException从一个电话到Invoke在尚未处理的表格上这是一些演示该问题的示例代码 public partial class Form2 Form void Form2 Load object
g++ 对于看似不相关的变量“警告：迭代...调用未定义的行为”

考虑以下代码strange cpp include
结构体指针的动态数组

我必须使用以下代码块来完成学校作业严格不进行任何修改 typedef struct char firstName char lastName int id float mark pStudentRecord pStudentRecord
Googletest：如何异步运行测试？

考虑到一个包含数千个测试的大型项目其中一些测试需要几分钟才能完成如果按顺序执行整套测试需要一个多小时才能完成通过并行执行测试可以减少测试时间据我所知没有办法直接从 googletest mock 做到这一点就像 async选项
是否可以在 C# 中强制接口实现为虚拟？

我今天遇到了一个问题试图重写尚未声明为虚拟的接口方法的实现在这种情况下我无法更改接口或基本实现而必须尝试其他方法但我想知道是否有一种方法可以强制类使用虚拟方法实现接口 Example interface IBuilder

随机推荐

从 Angular 前端调用 Azure AD 安全 Web API

我目前正在开发一个 Angular 前端它使用 MSAL 来对用户进行身份验证该前端应调用 Web API 也托管在 Azure 中该 API 由 Azure Active Directory 保护虽然我轻松地设法使用 Angula
如何停止 SwingWorker？

我怎样才能阻止SwingWorker做他的工作吗我知道有cancel 方法但我最多能做的就是匿名创建一个新的SwingWorker这就是工作这是供参考的代码 public void mostrarResultado final Res
.Net Core 3 Worker 集成测试

对于集成测试 Asp Net Core 应用程序我们有Web应用程序工厂 https learn microsoft com en us aspnet core test integration tests view aspnetcore
使用 JNDI 获取 DNS SRV 记录

我正在尝试使用 JNDI 从 DNS 服务器获取 SRV 记录 Hashtable
哪个更好？ Qt Creator 或 Visual Studio IDE [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我目前在我的 Qt 应用程序中使用 Qt Creator 1 3 我知道它使用jom for make当我们拥有多核处理器时这一步会更好但除
Twig 标签包含与函数包含

Twig 的文档标签包括 http twig symfony com doc tags include html看起来非常相似功能包括 http twig symfony com doc functions include html 标签包
如何从java中的JSON文件中删除键值对

我想知道是否有人可以帮助我或提示我如何用 Java 编辑附加的虚拟 JSON 文件正如您所看到的我有一个头对象其中包含许多遵循相同模式的值和子对象我想知道是否有办法删除所有值为 1的键以下是我根据许多网站使用的尝试jackson
根据javascript中的文本行数更改文本区域的高度[重复]

这个问题在这里已经有答案了可能的重复使用原型自动调整文本区域大小 https stackoverflow com questions 7477 autosizing textarea using prototype 如何根据用户放入文本
JWT 不记名令牌流程

我想要的是 ASP NET Core 中 JWT 生成和 JWT 消耗的方法没有 OAuth2 流程我确实有 IdentityServerv3 与 OAuth2 配合使用但当我拥有双方时对于访问 API 的单个应用程序来说这有点过
Slick Slider slickGoTo 方法打破轮播

我正在开发一个新闻文章页面该页面也有一个图像库我在用着光滑的滑块 http kenwheeler github io slick 用于画廊上的缩略图图库中的每张图片都有自己的网址用于广告查看目的不太好但我对此无能为力例如 ou
如何在flutter中定义自定义文本主题？

如何制作自己的文字主题风格我只找到这样的默认文本主题但这还不够 textTheme TextTheme body1 TextStyle body2 TextStyle button TextStyle caption TextStyle
Python字典和集合内存分配

I found 这个优秀的资源 https www safaribooksonline com library view high performance python 9781449361747 ch04 html讨论 python 字典
如何在 Cypress 中存储图像的 src 并将其与另一个图像进行比较？

测试目标是确认如果用户上传新图像则上传图像的 src 属性会发生更改这意味着图像已更改我尝试使用几种方法概述如下第一种方法 cy get img then img gt store the src const source img
Chrome 会混淆使用 SVG 格式的网络字体设计的文本（有时）

Demo http jsbin com onixik 2 http jsbin com onixik 2 内容如下如果您在 Windows 上的 Chrome 中检查该演示它可能看起来不错也可能不太好我所说的 OK 是指它并不引人注
更改 tkinter 中的输入框背景颜色

所以我一直在研究这个程序但我发现很难找出问题所在我对 tkinter 还很陌生所以这可能很小我试图让程序在按下复选按钮时更改输入框的背景颜色或者更好的是如果我可以动态地改变它那就更好了这是我目前的代码 TodayReadin
在Java中无损JPEG旋转（90/180/270度）？

是否有一个 Java 库可以以 90 度的增量旋转 JPEG 文件而不会导致图像质量下降我找到了这个 http mediachest sourceforge net mediautil http mediachest sourcefor
使用 Azure 管道在特定的自托管服务器上运行

在 Azure git 中我正在运行一些自托管代理它们位于名为默认的池中在 Azure 管道 yml 文件中我可以告诉作业它必须在特定代理中运行如下所示 pool name Default demands Agent Nam
假装电报机器人正在打字？

如何让机器人假装正在输入消息当机器人假装打字时聊天中会出现以下文本我用的是蟒蛇aiogram https github com aiogram aiogram框架但对原生 Telegram API 的建议也会有所帮助我认真建议使用
MySQL CSV 导入 - 如果时间戳有毫秒，则日期输入为 0000-00-00 00:00:00？

我目前有大量 CSV 需要导入到 MySQL 数据库中这些文件包含每条记录的时间戳其格式如下例如 2011 10 13 09 36 02 297000000 我知道 MySQL 错误 8523 它表明不支持在日期时间字段中存储毫秒尽
如何强制 GCC 假定浮点表达式为非负？

在某些情况下您知道某个浮点表达式始终为非负数例如当计算向量的长度时 sqrt a 0 a 0 a N 1 a N 1 NB I am意识到std hypot 这与问题无关并且平方根下的表达式显然是非负的然而海湾合作委员会outp

如何强制 GCC 假定浮点表达式为非负？

你想要的是-fno-math-errno，这在全球范围内都是安全的

如何强制 GCC 假定浮点表达式为非负？ 的相关文章

随机推荐

热门标签

你想要的是`-fno-math-errno`，这在全球范围内都是安全的

如何强制 GCC 假定浮点表达式为非负？的相关文章