为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？

2024-01-09

在摆弄简单的 C 代码时，我注意到一些奇怪的事情。 ICC为何产生incl %eax在为增量生成的汇编代码中而不是addl $1, %eax？不过，GCC 的行为符合预期，使用add.

示例代码（-O3用于 GCC 和 ICC）

int A, B, C, D, E;

void foo()
{
    A = B + 1;
    B = 0;
    C++;
    D++;
    D++;
    E += 2;
}

ICC 结果

L__routine_start_foo_0:
foo:
    movl      B(%rip), %eax                                 #5.13
    movl      D(%rip), %edx                                 #8.9
    incl      %eax                                          #5.17
    movl      E(%rip), %ecx                                 #10.9
    addl      $2, %edx                                      #9.9
    addl      $2, %ecx                                      #10.9
    movl      %eax, A(%rip)                                 #5.9
    movl      $0, B(%rip)                                   #6.9
    incl      C(%rip)                                       #7.9
    movl      %edx, D(%rip)                                 #9.9
    movl      %ecx, E(%rip)                                 #10.9
    ret

例如，参见here http://goo.gl/WThWRw.

因此，我想知道 - 这是一个预期的功能、一个错误还是某些特定设置导致的一些怪癖？如果add（据说）由于标志更新或效率更好（这是基于下面链接的结论） - 为什么 ICC 使用inc?

x86 inc 与 add 指令的相对性能 https://stackoverflow.com/questions/5993326/relative-performance-of-x86-inc-vs-add-instruction

ADD 1 真的比 INC 快吗？ x86 https://stackoverflow.com/questions/13383407/is-add-1-really-faster-than-inc-x86

GCC 不使用 inc https://stackoverflow.com/questions/19890157/gcc-doesnt-make-use-of-inc

Note:

我明确地问这个问题是因为我发现的或针对的问题都没有解释这种行为。我之前关于此事的问题已经结束，因为据推测，它是trivial and 已得到答复。我不认为这微不足道。我没有在给出的所有链接和答案中找到答案。这不是另一个“如何将鼠标插入电脑”的问题。所有的问题都解释了原因add在新的 x86 处理器上是否/可能会更好或者为什么 GCC 使用它，但没有涉及 ICC。

任何有关 ICC 设计选择的见解也将受到欢迎。

PS 我不认为“它这样做是因为它确实如此”是一个有效的答案。

此时假设incl之所以被选中，是因为它只需要一个字节 (0x40)，而不是三个字节 (0x83 0xc0 0x01)。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？的相关文章

高级 Win32 图像文件 I/O？

我想在 Windows C 应用程序中将图像文件读入内存什么是一个相当简单的解决方案也许类似于 IOS 提供的UIImage 我希望支持合理数量的文件格式我需要为图像处理的位图提供一些低级访问权限我在互联网上阅读了很多内容看起来
Web UI 中的 .Result 出现死锁

我正在阅读以下主题http blog stephencleary com 2012 07 dont block on async code html http blog stephencleary com 2012 07 dont bloc
如何调试参数化 SQL 查询

我使用 C 连接到数据库然后使用 Ad hoc SQL 来获取数据这个简单的 SQL 查询非常方便调试因为我可以记录 SQL 查询字符串如果我使用参数化 SQL 查询命令有没有办法记录 sql 查询字符串以进行调试我想就是这样的
将 2D 数组映射到 1D 数组

我想用一维数组来表示一个二维数组函数将传递两个索引 x y 和要存储的值这两个索引代表一维数组的单个元素并相应地设置它我知道一维数组需要具有 arrayWidth arrayHeight 的大小但我不知道如何设置每个元素例如如
处理 LINQ sum 表达式中的 null

我正在使用 LINQ 查询来查找列的总和并且在少数情况下该值有可能为空我现在使用的查询是 int score dbContext domainmaps Where p gt p SchoolId schoolid Sum v gt v
在 Windows Phone 上启动 pdf 文件时出现 System.Runtime.InteropServices.COMException

我正在尝试使用我之前在另一个应用程序上使用过的以下工作代码打开 pdf 文件但这一次当流程到达此行时我收到 System Runtime InteropServices COMException Windows System Laun
阅读 Stack Overflow RSS 源

我正在尝试获取未回答问题的列表the feed https stackoverflow com feeds 但我在阅读时遇到困难 const string RECENT QUESTIONS https stackoverflow com f
C++ 在 Vector 中使用不可分配的对象

我想将对象列表存储在std vector 但对象包含引用且无法分配给但是我可以复制构造该对象我能想到的唯一选择是使用指针来包装对象并在需要分配指针时重新设置指针但这样做的语法会显着降低可读性特别是在使用迭代器时我更喜欢另一种选择
Qt中正确的线程方式

我的图像加载非常耗时图像很大并且在加载时也完成了一些操作我不想阻止应用程序 GUI 我的想法是在另一个线程中加载图像发出图像已加载的信号然后用该图像重绘视图我的做法 void Window loadImage ImageLoad
根据拦截和返回值自动重试客户端WCF调用

是否可以拦截 WCF 调用的结果并重试该操作例如操作的返回值可能包含状态代码指示我传递到原始调用的会话令牌已过期在这种情况下我可以检索新的会话令牌并使用新的会话令牌重试调用是否可以通过使用 WCF 拦截返回值检查它然后以对操
如何在不使用reinterpret_cast的情况下使用dlsym()加载函数？

我正在尝试使用 clang tidy 来强制执行 C 核心指南虽然它确实有很多有效点但有一件事我无法真正解决 dlsym 返回一个void 我需要以某种方式将其转换为正确的函数指针为此我使用reinterpret cast 由于指南
_mm_max_ss 在 clang 和 gcc 之间有不同的行为

我正在尝试使用 clang 和 gcc 交叉编译一个项目但在使用时发现一些奇怪的差异 mm max ss e g m128 a mm set ss std numeric limits
当格式字符串包含“{”时，String.Format 异常

我正在使用 VSTS 2008 C Net 2 0 执行以下语句时 String Format 语句抛出 FormatException 有什么想法是错误的吗这是获取我正在使用的 template html 的位置我想在 templat
C++ Primer 5th Edition 错误 bool 值没有指定最小大小？

bool 的最小大小不应该是 1 个字节吗这有点学术性的东西尽管它们会转换为数字并且与其他所有事物一样它们最终将基本上由计算机内存中的数字表示但布尔值不是数字你的bool可以取值true 或值false 即使您确实需要至少 1
标准 C 中的 sizeof 与 sizeof()？ [复制]

这个问题在这里已经有答案了我看到一些直接使用 sizeof 的代码想知道它是否是标准 C 令我惊讶的是它运行得很好这是一个例子 include
编写专门用于类及其子类的函数模板

我正在尝试编写一个函数模板一个版本应该用于不满足另一版本标准的所有类型当参数是给定类的基类或该类本身时应使用另一个版本我尝试过超载Base 但是当类派生自Base 他们使用通用的而不是特定的我也尝试过这种 SFINAE 方法 s
改进C++逐行读取文件的能力？

我正在解析大约 500GB 的日志文件我的 C 版本需要 3 5 分钟我的 Go 版本需要 1 2 分钟我正在使用 C 的流来流式传输文件的每一行以进行解析 include
如何使用 g++ 在 c++ 20 中使用模块？

我读了这个链接https gcc gnu org wiki cxx modules https gcc gnu org wiki cxx modules并尝试从该网站复制以下示例我已经知道这个编译器部分支持模块系统注我用的是windo
局部静态变量初始化是线程安全的[重复]

这个问题在这里已经有答案了假设我有一个包含三个静态函数的类如下所示 include
C++0x 中的新 unicode 字符

我正在构建一个 API 它允许我获取各种编码的字符串包括 utf8 utf16 utf32 和 wchar t 根据操作系统可能是 utf32 或 utf16 新的 C 标准引入了新类型char16 t and char32 t没有这么

随机推荐

PYTHONPATH 不适用于 GNU/Linux 上的 sudo（适用于 root）

编辑适用于 root sudo 是问题所在参见下文我有一个包含我自己的库的目录例如我的 Python 库位于 home name lib py 我已将此目录添加到Python 的路径对于所有用户包括 root 添加以下行 etc
半音阶乐器调音器的稳健算法？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案谁知道半音阶乐器调音器最强大的算法我正在尝试编写一个乐器调音器我尝试过以下两种算法 FFT 创建韦尔
哪个 OpenSSL 版本支持 SHA256？

我编写了一个 PHP 库它使用openssl verify and openssl sign 使用 SHA256 我认为 SHA256 支持对于 PHP 和 OpenSSL 来说是一种新功能但我不知道哪个版本开始支持 SHA256 这会
将逗号分隔的字符串转换为单独的行

我有一个这样的 SQL 表 SomeID OtherID Data abcdef cdef123 18 20 22 abcdef 4554a24 17 19 987654 12324a2 13 19 20 是否有一个查询可以执行类似的查询S
C++ 函数模板编译错误“‘containerType’不是模板”

我正在尝试编写一个函数来字符串化参数以用于记录目的例如我想写这样的东西 vector
DirectX 或 OpenGL [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案如果您正在用 C 编写下一个 3D 图形密集型应用程序例如 3D 建模和动画软件那么哪一个是更好的选择如果我们认为 C 是独立于平台的那
如何配置此 Spring-Boot 应用程序以使用 IAM 角色而不是密钥和机密？

我有一个与 S3 和 SQS 通信的 Spring Boot 应用程序它使用 AWS 密钥和机密工作得很好但我发现我有一个限制因为我不能使用这些凭证而必须使用 IAM 实例角色进行身份验证我没有运气让这个微小的改变发挥作用我创建
消息队列和共享内存的区别？

我读了很多关于消息队列和共享内存之间差异的文章但仍不清楚哪一种有利于获得良好的性能就像共享内存应该比队列更好但在同步它的情况下也存在性能问题共享内存和消息队列都可以用来在进程之间交换信息区别在于how他们被使用了共享内存正如您所
如何在 Vim 中的 html 标签之间粘贴内容？

紧迫p将内容粘贴到当前行下方 dit删除 html 标签内的内容如何在 html 标签内粘贴内容 Nor here p I want to paste something here p Not here 我通常只是这样做vitp它直观地选
VS 2010可以自动检查/更新头文件吗？

这几乎就是我的问题 VS 2010 可以自动检查和更新 C 代码中的头文件吗 VS 2010可以自动从头文件生成cpp文件从而节省您从头文件复制函数定义的时间吗我的意思是它是否可以认为某些方法没有实现并从头文件中找到的声明生成一个空
量角器可以慢速运行吗？

有没有办法缓慢运行使用量角器编写的 Angular E2E 测试以便我可以观察正在发生的情况以下是我的解决方案所以基本上我为当前控制流创建了一个装饰器execute函数现在在每个排队操作之前额外排队 100 毫秒的延迟这需要在调用
Spring MVC @ResponseBody 返回一个列表

我们想创建一个 WebService 它返回特定对象的列表我们想通过 apache http 客户端库从另一个 java 程序调用这个 Web 服务此时如果我们从 Firefox 中调用 Web 服务则会出现 406 错误页面我们
Spring 安全和 JSON 身份验证

我在 spring spring mvc 中有一个完全使用 JSON 通信的应用程序现在我需要通过 JSON 使用 spring security 3 使用 LdapAuthenticationProvider 对我的应用程序进行身份验证
Doctrine 2.0 中未加载延迟加载属性

我正在使用 PHP 和 Doctrine 2 0 所有实体都工作正常除了下面详细介绍的实体关系或者其他实体在我没有注意到的地方失败考虑以下实体 Entity class Target ManyToOne targetEntity k
根据浏览器应用不同的 CSS 宽度属性？（IE8、FF）

我必须将宽度应用于 div 宽度值需要根据浏览器的不同而变化我无法应用条件 css 那么有什么办法可以做到这一点吗 FF apply width 720px IE8 apply width 690px 可以使用一些技巧将它们组合起来以便
如何在Android中注册睡眠事件？

我正在开发 Android 3 0 我需要在我的应用程序中知道设备何时进入睡眠关闭屏幕我如何注册此意图事件以便在发生这种情况时我能够运行一些操作 BroadcastReceiver 中是否有任何通知此操作的操作 This http
图库中的图像自动旋转 - Android

在我的 Android 应用程序中我正在从设备库加载图像在这方面我面临着有关图像方向的问题当我从图库加载高分辨率图像时它们会自动旋转然后显示在我的视图中我尝试了有关此问题的各种解决方案但无法得到正确的解决方案我提到获取方向
如何正确转义 Makefile 的数据？

我正在动态生成config mk带有将由 Makefile 使用的 bash 脚本该文件的构造如下 cat gt config mk lt
DMA 与中断驱动的 I/O

我不太清楚 DMA 和中断 I O 之间的区别当前正在阅读操作系统概念第 7 版具体来说我不确定在这两种情况下何时会发生中断以及在这两种情况下 CPU 在什么时候可以自由地执行其他工作我一直在读但不一定能调和的东西中断驱动通
为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？

在摆弄简单的 C 代码时我注意到一些奇怪的事情 ICC为何产生incl eax在为增量生成的汇编代码中而不是addl 1 eax 不过 GCC 的行为符合预期使用add 示例代码 O3用于 GCC 和 ICC int A B C D E

为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？

为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？ 的相关文章

随机推荐

热门标签

为什么 ICC 在 x86 上的汇编中生成“inc”而不是“add”？的相关文章