为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？

2024-03-26

考虑以下代码：

void foo(float* __restrict__ a)
{
    int i; float val;
    for (i = 0; i < 100; i++) {
        val = 2 * i;
        a[i] = val;
    }
}

void bar(float* __restrict__ a)
{
    int i; float val = 0.0;
    for (i = 0; i < 100; i++) {
        a[i] = val;
        val += 2.0;
    }
}

它们基于 Agner Fog 中的示例 7.26a 和 7.26b用 C++ 优化软件 http://www.agner.org/optimize/optimizing_cpp.pdf并且应该做同样的事情；bar更“高效”，因为我们不在每次迭代时进行整数到浮点转换，而是进行更便宜的浮点加法（在 x86_64 上）。

Here https://godbolt.org/g/c7LXQD是这两个函数的 clang 和 gcc 结果（没有矢量化和展开）。

问题：在我看来，用常量值的加法替换循环索引的乘法的优化 - 当这有益时 - 应该由编译器执行，即使（或者可能特别是如果）涉及类型转换。为什么这两个函数没有发生这种情况？

请注意，如果我们使用 int 而不是 float：

void foo(int* __restrict__ a)
{
    int i; int val = 0;
    for (i = 0; i < 100; i++) {
        val = 2 * i;
        a[i] = val;
    }
}

void bar(int* __restrict__ a)
{
    int i; int val = 0;
    for (i = 0; i < 100; i++) {
        a[i] = val;
        val += 2;
    }
}

clang 和 gcc 都执行预期的优化，尽管方式不完全相同（请参阅这个问题 https://stackoverflow.com/questions/48354636/is-multiplying-via-the-addressing-mode-a-good-idea).

您正在寻找启用归纳变量优化 https://en.wikipedia.org/wiki/Induction_variable#Application_to_strength_reduction对于浮点数。这种优化在浮点领域通常是不安全的，因为它会改变程序语义。在你的例子中它会起作用，因为两个初始值（0.0）和步骤（2.0) 可以用 IEEE 格式精确表示，但在实践中这种情况很少见。

它可以在下面启用-ffast-math但在 GCC 中这似乎并没有被认为是重要的情况，因为它很早就拒绝了非整数归纳变量（参见树标量进化.c https://github.com/gcc-mirror/gcc/blob/428c12fad2565e3568d2d822942919da78350dc0/gcc/tree-scalar-evolution.c#L3326).

如果您认为这是一个重要的用例，您可以考虑在以下地址提交请求：GCC Bugzilla https://gcc.gnu.org/bugzilla/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？的相关文章

'goto *foo' 其中 foo 不是指针。这是什么？

我正在玩标签作为值 https gcc gnu org onlinedocs gcc Labels as Values html并最终得到这段代码 int foo 0 goto foo 我的 C C 经验告诉我 foo means dere
将 num 的签名键入 double？

我才刚刚开始为你学习 Haskell 以获得伟大的好处并且我在类型类方面遇到了一些麻烦我想创建一个接受任何数字类型并强制其为双精度的函数我的第一个想法是定义 numToDouble Num gt Double 但我认为这不起作用因为
将 System.Drawing.Image 转换为 System.Windows.Media.ImageSource 但没有结果

我想在我的 WPF 应用程序中将 Image 转换为 ImageSource 我使用正常工作的 Code128 库已在 WinForms 应用程序中检查下面的函数返回具有适当大小的 ImageSource 但没有任何内容可见 priva
sy.sympify(str(表达式)) 不等于表达式

据我了解 str将 SymPy 表达式转换为字符串并sympify将字符串转换为 SymPy 表达式因此我希望以下内容成立对于合理的表达 gt gt gt sy sympify str expr expr True 我尝试过这个确实
这个反斜杠在这段汇编代码中起什么作用？

我不确定这些推线有什么区别修剪下来来自 Linux 的 x86 entry calling h https github com torvalds linux blob 241e39004581475b2802cd63c111fec43b
如何编译GCC生成的asm？

我正在玩一些汇编代码有些事情困扰着我我编译这个 include
使用 mingw32 在 Windows 上构建 glew 时“DllMainCRTStartup@12”的多个定义

我关注了这个主题使用 mingw 使建筑物在 Windows 上闪闪发光 https stackoverflow com questions 6005076 building glew on windows with mingw 6005
在 C++17 中使用成员的链接错误

我在 Ubuntu 16 04 上使用 gcc 7 2 并且需要使用 C 17 中的新文件系统库尽管确实有一个名为experimental filesystem的库但我无法使用它的任何成员例如当我尝试编译此文件时 include
Ubuntu 11.10 上的 c 数学链接器问题 [重复]

这个问题在这里已经有答案了我从 Ubuntu 升级后出现了一些奇怪的错误 10 11 11 04 i dont know 到 11 10 我正在得到一个undefined reference to sqrt 使用 math h 时并与 l
如何在 Mac 上安装 Clang 9？

这是我 Mac 上的内容 clang version Apple LLVM version 10 0 0 clang 1000 10 44 4 Target x86 64 apple darwin17 7 0 Thread model po
arm-linux-gnueabi 编译器选项

我在用 ARM Linux gnueabi gcc在 Linux 中为 ARM 处理器编译 C 程序但是我不确定它编译的默认 ARM 模式是什么例如对于 C 代码 test c unsigned int main return 0x
C99 中数组的静态大小[重复]

这个问题在这里已经有答案了一个非常简单的 C 程序 include
如何将 Java 地图转换为在 Scala 中使用？

我正在开发一个 Scala 程序该程序调用 Java 库中的函数处理结果并生成 CSV 有问题的 Java 函数如下所示 Map
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
将 Powershell 输出转换为 Markdown 文件

我有以下代码 xmlFile C Users kraer Desktop bom xml xml xml Get Content xmlFile xml bom components component ForEach Object fin
gcc 与 clang：符号剥离

gcc 和 AMD Open64 opencc 都有一个 s选项剥离符号表和重定位信息到目前为止我还没能在 Clang LLVM 中找到相同的选项它存在吗您可以使用stripbinutils 中的实用程序实际上 llvm ld 有
Pyaudio 安装错误 - “命令‘gcc’失败，退出状态 1”

我正在运行 Ubuntu 11 04 Python 2 7 1 并想安装 Pyaudio 于是我跑了 sudo easy install pyaudio 在终端中进程退出并显示以下错误消息 Searching for pyaudio Re
为什么 char name[1] 可以容纳超过 1 个字符？ [复制]

这个问题在这里已经有答案了当我遇到这种情况时我正在对一个主题进行一些研究假设有以下 C 代码 include
链接器问题 - 未定义的引用

我的编译器有问题告诉我有一个未定义的引用我想在库中使用的函数让我分享一些有关该问题的信息我正在用 gcc 交叉编译 C 语言我正在调用一个库函数该函数通过包含的标头访问其中包含另一个标头其中包含原型我已经使用 I 包含了
如何在 GCC C++ 中编写多行内联汇编代码？

这看起来不太友好 asm command 1 command 2 command 3 我真的必须在每一行加上双引号吗另外由于多行字符串文字在 GCC 中不起作用我也无法欺骗它我总是在互联网上找到一些例子该人手动插入制表符和换行符而

随机推荐

这个 Haskell 函数的类型签名是什么？

我写了一个函数来检查一个数字是否是质数 prime n prime n 2 floor sqrt n where prime n c u n mod c 0 False c gt u True otherwise prime n c 1 u
Swift 可选链在闭包中不起作用

我的代码看起来像这样我的班级有一个可选的变量 var currentBottle BottleLayer BottleLayer有一个方法jiggle 这段代码使用可选链接在我的类中编译得很好 self currentBottle ji
Gradle：使用注释过滤测试所需的指导

我们正在开发一个大型测试套件旨在运行在多种环境上例如烟雾性能全套等我们目前使用 JUnit 作为测试框架我们想要实现的是注释测试类或方法或两者带有一个或多个注释例如 SmokeTest PerformanceTest Ac
响应缓存在 asp.net core 项目中不起作用

我尝试在 asp net core 项目中实现响应缓存但它不起作用这是startup cs public void ConfigureServices IServiceCollection services services AddRe
获取 Facebook 应用程序的应用程序访问令牌？

我读过这个尝试获取应用程序访问令牌 https stackoverflow com questions 12948809 trying to get app access token 而且这不起作用我收到以下错误 error messa
“运算符不存在：uuid = bytea”Java 与 Postgres

我在引用此查询时遇到问题在 Postgres 上此查询执行时没有错误在JAVA上会抛出以下异常 javax persistence PersistenceException org hibernate exception SQLGr
德鲁伊 vs Elasticsearch

我是德鲁伊新手我已经看过 druid VS Elasticsearch 但还是不知道druid擅长什么以下是我的问题我有一个有 70 个节点的 solr 集群我在 solr 中有一个非常大的表有 10 亿行每行有 100 个字段
Akamai 传感器数据生成器，用于发布请求时的有效 _abck cookie (Python)

所以我试图在网站上进行自动结账但我一直被阻止因为我无法获得有效的 abck cookie 我在一些网站上看到人们付费所以编码员给他们传感器数据生成器我买不起所以我来这里寻找一些关于如何编码这个生成器的建议首先我必须创建一个以传
如何杀死使用多处理池 imap_unordered 时产生的线程

我正在尝试使用多处理池来加速一个简单的 Python 程序具体来说 imap unordered 函数就我而言我正在搜索具有特定属性的特定对象并且检查此属性需要很长时间因此我想将负载分散到 CPU 核心上我创建了以下代码 fro
TypeScript 3.0“未知”类型可以替代“any”或“泛型”吗？

https blogs msdn microsoft com typescript 2018 07 12 announcing typescript 3 0 rc the unknown type https blogs msdn micr
如何在Python中使用谷歌语音识别API？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 mp3 文件我想使用 Google 的语音识别功能从该文件中获取文本任何我可以找到文档或
蓝牙 didConnect 或 didFailToConnect 未在 iOS 11.1.2 中调用 Xcode 9.2

我在 Xcode 9 2 和 iOS 11 1 2 上遇到问题 didDiscover 工作正常在调用 connect 之前我的外设已保存在数组中但未调用 didConnect 或 didFailToConnect 因此外设状态将保持不
Firestore：涉及数组字段的索引创建实用程序中的错误

正在尝试 firestore array contains 功能我有一个projects具有数组字段的集合 projectUsers Query db collection projects where deleted false ord
“DataNucleus 增强器”错误 206

我有个问题我总是从 Java DataNucleus Enhancer 收到错误 206 因为两天前几天前它工作没有错误无法运行程序 D Program Files Java jre6 bin javaw exe 在目录 C Us
Facebook Messenger 机器人评论

我今天提交了我的机器人以供审核不幸的是 Facebook 似乎无法访问该机器人因为它不回复测试消息但是当我在开发者应用程序中将朋友提升为测试员时机器人工作得很好你们知道为什么机器人不响应 Facebook 测试吗 Thank
这是尾调用吗？（Javascript）

假设您有一个递归函数例如 Blah prototype add function n this total n this children forEach function child child add n Is the child a
将外部库放入 JAR 中？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我已经向我的 java 项目在 netbeans 中添加了一些外部库是否可以将外部 jar 库放入 java 存档中而不是将它们放
如何在 R 环境中迭代哈希项？

我正在尝试找到一种在 R 中使用哈希映射的方法经过一番搜索后我得到了 R 环境但如何迭代环境中的所有项目呢当我运行以下代码时我期待这样的输出 1 2 但我得到两行 NULL 我怎样才能得到我想要的东西 map lt new env
如何在 QWERTZ 键盘上输入 CTRL + ] （以便使用 Vim 跳转到标签）？

In Vim the usual way to jump to the definition of the keyword under the cursor is to type CTRL as claimed by he CTRL htt
为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？

考虑以下代码 void foo float restrict a int i float val for i 0 i lt 100 i val 2 i a i val void bar float restrict a int i floa

为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？

为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？ 的相关文章

随机推荐

热门标签

为什么 clang 和 gcc 不能优化这种 int 到 float 的转换？的相关文章