编译器如何为 C++ 中条件声明的自动变量分配内存？

2024-04-03

假设我有一个函数，根据某些运行时条件创建昂贵的自动对象或创建便宜的自动对象：

void foo() {
   if (runtimeCondition) {
       int x = 0;
   } else {
       SuperLargeObject y;
   }
}

当编译器为此函数分配堆栈帧的内存时，它是否会分配足够的内存来存储SuperLargeObject，并且如果条件导致int额外的内存真的不会被使用吗？或者它会以其他方式分配内存吗？

这取决于您的编译器和优化设置。在未优化的构建中，大多数 C++ 编译器可能会为两个对象分配堆栈内存，并根据采用的分支使用其中之一。在优化的构建中，事情变得更加有趣：

如果两个对象（int和SuperLargeObject没有被使用，编译器可以证明构造SuperLargeObject没有副作用，两个分配都将被省略。

如果对象逃逸该函数，即它们的地址被传递给另一个函数，则编译器必须为它们提供内存。但由于它们的生命周期不重叠，因此它们可以存储在重叠的内存区域中。这是否真的发生取决于编译器。

正如你在这里看到的 https://godbolt.org/z/4Efn19s69，不同的编译器为这两个函数生成不同的程序集：（来自OP和参考的修改示例，全部针对x86-64编译）

void escape(void const*);

struct SuperLargeObject {
    char data[104];
};

void f(bool cond) {
    if (cond) {
        int x;
        escape(&x);
    }
    else {
        SuperLargeObject y;
        escape(&y);
    }
}

void g() {
    SuperLargeObject y;
    escape(&y);
}

请注意，所有堆栈分配都是 8 的奇数倍，因为 x86-64 ABI 要求堆栈指针按 16 字节对齐，并且 8 字节由call返回地址的说明（感谢@PeterCordes 在上向我解释这一点另一个帖子 https://stackoverflow.com/questions/76291937/size-of-stack-allocations-produced-by-llvms-x86-64-backend?noredirect=1#comment134535786_76291937).

ICC

f(bool):
        sub       rsp, 120
        test      dil, dil
        lea       rax, QWORD PTR [104+rsp]
        lea       rdx, QWORD PTR [rsp]
        cmovne    rdx, rax
        mov       rdi, rdx
        call      escape(void const*)
        add       rsp, 120
        ret
g():
        sub       rsp, 104
        lea       rdi, QWORD PTR [rsp]
        call      escape(void const*)
        add       rsp, 104
        ret

ICC 似乎分配了足够的内存来存储两个对象，然后根据运行时条件在两个非重叠区域之间进行选择（使用cmov) 并将选定的指针传递给转义函数。

在参考函数中g它只分配 104 字节，正好是SuperBigObject.

GCC

f(bool):
        sub     rsp, 120
        mov     rdi, rsp
        call    escape(void const*)
        add     rsp, 120
        ret
g():
        sub     rsp, 120
        mov     rdi, rsp
        call    escape(void const*)
        add     rsp, 120
        ret

GCC 也分配 120 字节，但它将两个对象放置在同一地址，因此不会发出任何信号cmov操作说明。

Clang

f(bool):
        sub     rsp, 104
        test    edi, edi
        mov     rdi, rsp
        call    escape(void const*)@PLT
        add     rsp, 104
        ret
g():
        sub     rsp, 104
        mov     rdi, rsp
        call    escape(void const*)@PLT
        add     rsp, 104
        ret

Clang 还合并了两个分配，并将分配大小减少到必要的 104 字节。

不幸的是我不明白为什么它测试功能中的条件f.

您还应该注意，当编译器可以将一个或两个变量放入寄存器中时，根本不会分配内存，即使它们在整个函数中使用和重新分配也是如此。为了int's and long和其他小对象是最常见的情况，如果它们的地址不转义该函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

编译器如何为 C++ 中条件声明的自动变量分配内存？的相关文章

C++ 中的软（不是：弱）引用 - 这可能吗？有实施吗？

在 C 中我正在使用boost shared ptr and boost weak ptr自动删除不再需要的对象我知道这些与引用计数一起工作在 Java 中内存由垃圾收集器管理它将内置对象引用视为strong WeakReferen
添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
如何进行带有偏差的浮点舍入（始终向上或向下舍入）？

我想以偏置舍入浮动要么总是向下要么总是向上代码中有一个特定的点我需要这个程序的其余部分应该像往常一样四舍五入到最接近的值例如我想四舍五入到最接近的 1 10 倍数最接近 7 10 的浮点数约为 0 69999998807 但
为什么基类必须有一个带有 0 个参数的构造函数？

这不会编译 namespace Constructor0Args class Base public Base int x class Derived Base class Program static void Main string a
如果.Net Core可以在Windows上运行，为什么不能在.Net Framework中引用.Net Core DLL？

我明白为什么 Net Framework 可能会在 Net Core IE 中导致问题因为不存在特定于 Windows 平台的 API 但是为什么不能直接引用 Net Core 作为 Net Framework 中的库呢如果 Net C
使用实体框架从集合中删除项目

我正在使用DDD 我有一个 Product 类它是一个聚合根 public class Product IAggregateRoot public virtual ICollection
如何用 kevent() 替换 select() 以获得更高的性能？

来自Kqueue 维基百科页面 http en wikipedia org wiki Kqueue Kqueue 在内核和用户空间之间提供高效的输入和输出事件管道因此可以修改事件过滤器以及接收待处理事件同时每次主事件循环迭代仅使用对
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
转到 C# WPF 中的第一页

我正在 WPF 中使用导航服务为了导航到页面我使用 this NavigationService Navigate new MyPage 为了返回我使用 this NavigationService GoBack 但是如何在不使用的情况
Xamarin Android：获取内存中的所有进程

有没有办法读取所有进程而不仅仅是正在运行的进程如果我对 Android 的理解正确的话一次只有一个进程在运行其他所有进程都被冻结后台进程被忽略您可以使用以下代码片段获取当前正在运行的所有 Android 应用程序进程 Activ
事件日志写入错误

很简单我想向事件日志写入一些内容 protected override void OnStop TODO Add code here to perform any tear down necessary to stop your serv
通过等待任务或访问其 Exception 属性都没有观察到任务的异常

这些是我的任务我应该如何修改它们以防止出现此错误我检查了其他类似的线程但我正在使用等待并继续那么这个错误是怎么发生的呢通过等待任务或访问其 Exception 属性都没有观察到任务的异常结果未观察到的异常被终结器线程重新抛出
从匿名类型获取值

我有一个方法如下 public void MyMethod object obj implement 我这样称呼它 MyMethod new myparam waoww 那么我该如何实施MyMethod 获取 myparam 值 Edit
Silverlight Datagrid：在对列进行排序时突出显示整个列

我的 Silverlight 应用程序中有一个 DataGrid 我想在对该列进行排序时突出显示整个列它在概念上与上一个问题类似 Silverlight DataGrid 突出显示整列 https stackoverflow com qu
gdb查找行号的内存地址

假设我已将 gdb 附加到一个进程并且在其内存布局中有一个文件和行号我想要其内存地址如何获取文件x中第n行的内存地址这是在 Linux x86 上 gdb info line test c 56 Line 56 of test c
Fluent NHibernate 日期时间 UTC

我想创建一个流畅的 nhibernate 映射来通过以下方式映射 DateTime 字段保存时保存 UTC 值读取时调整为本地时区值实现此映射的最佳方法是什么就我个人而言我会将日期存储在 UTC 格式的对象中然后在读写时在
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
如何查明CONFIG_FANOTIFY_ACCESS_PERMISSIONS是否启用？

我想利用fanotify 7 http man7 org linux man pages man7 fanotify 7 html我遇到的问题是在某些内核上CONFIG FANOTIFY ACCESS PERMISSIONS不起作用虽然C
热重载时调用方法

我正在使用 Visual Studio 2022 和 C 制作游戏我想知道当您热重新加载应用程序当它正在运行时时是否可以触发一些代码我基本上有 2 个名为 UnloadLevel 和 LoadLevel 的方法我想在热重载时执行它
boost::program_options：带有固定和可变标记的参数？

是否可以在 boost program options 中使用此类参数 program p1 123 p2 234 p3 345 p12 678 即是否可以使用第一个标记指定参数名称例如 p 后跟一个数字是动态的吗我想避免这种情况

随机推荐

如何使用 Prolog 查找二叉树的深度

我正在学习 Prolog 并试图找到一个深度二叉树使用 Prolog 我代表一棵树是这样的 nil is a tree tree 1 nil nil this is a leaf tree 1 tree 1 nil nil nil this
Rails 4 热切负载限制子查询

有没有办法避免急切加载时的 n 1 问题并对子查询应用限制我想避免大量这样的 sql 查询 Category all each do category category posts limit 10 end 但我也希望每个类别只获取 10
在 PHP 中将值数组转换为单个浮点值？

我有一个包含这些值的数组当数组打印为print r Array 0 gt 66 1 gt 233 2 gt 204 3 gt 205 十六进制值是 Array 0 gt 0x42 1 gt 0xE9 2 gt 0xCC 3 gt 0xCD
R 闪亮盒子中可移动多个项目 - 类似于所附屏幕截图

我正在尝试构建一个闪亮的应用程序我正在尝试构建类似于下面的屏幕截图的功能我已经使用 Shinyjqui sortable 构建了类似的东西但我想在移动项目之前允许多重选择请告诉我是否有人构建从事过类似的事情下面是我使用 shin
由于图像太多，应用程序尺寸太大

我正在创建一个通用应用程序对于一个屏幕我使用以下命令在网格中显示 6 个图像 png 格式 this https github com gmoledina GMGridView控制此外该屏幕支持纵向和横向我为所有 iDevice
VM/解释器的性能改进策略？

我用 C 语言编写了一个简单的 VM 使用简单的指令切换没有任何指令解码但性能很糟糕对于简单的算术运算对于相同的运算 VM 比本机 C 代码慢大约 4000 倍我测试了一组长度为1000万的数组第一个数组由程序指令随机操作组
Javascript 查找除标记之外的所有文本

我有一个 div 这个 div 可以或不能将 html 元素作为子元素使用我的 javascript 我需要找到该 div 中出现的所有单词除了那些在 a tag 例如 div Lorem ipsum dolor sit amet
将 GLSurfaceView 类与 Android xml 布局结合使用

我想利用 android xml 布局我已将 glSurfaceView 放入框架布局中以便与线性布局结合使用如下所示
使用 Swift 将当前时间设置为 yyyy-MM-dd 00:00:00

我想问一下NSDate 如何设置格式化当前时间如 2015 08 12 09 30 41 0000 到 2015 08 12 00 00 00 0000 我已经在使用 var dateFormatter NSDateFormatter
Python doctest：有条件地跳过测试

我知道如何使用跳过文档测试 doctest SKIP 但我不知道如何跳过测试有时基于运行时条件例如 gt gt gt if os path isfile foo open foo readlines else pass doctest
jQuery 取消和重置幻灯片动画

我正在编写一些 jQuery 来切换 div 在伪代码中应该执行以下操作 item click check to see if the div I want to expand is hidden if so slideup all of
如何汇总正在进行的编程

我正在为 MRP 程序编写一份报告其中包含一个我计算的订购数量的字段如果它是小数点我需要将其四舍五入例如 2 33需要向上舍入为3等等我努力了 oder round order 0 但这只给我 2 00 我需要将该数字四舍五入到下
如何在使用按位运算添加两个整数时添加无限循环的代码修复

这是原件question https stackoverflow com questions 39113479 infinite loop while adding two integers using bitwise operations
正则表达式用于匹配某些内容（如果前面没有其他内容）

对于Java中的正则表达式我想编写一个当且仅当模式前面没有某些字符时才匹配的正则表达式例如 String s foobar barbar beachbar crowbar bar 我想匹配如果bar前面没有foo 所以输出将是 barb
在 Cocoa/Carbon 中全局隐藏鼠标光标？

有没有办法全局隐藏 Cocoa 或 Carbon 中所有应用程序的鼠标光标或者至少用其他东西代替它编辑感谢大家的意见但事实证明 Daniel Jalkut 不久前找到了解决方案 http lists apple com archiv
Lisp 中的数组与列表：为什么下面的代码中的列表要快得多？

我在解决时得到了意想不到的结果欧拉计划中的问题 75 https projecteuler net problem 75 我的代码确实找到了正确的解决方案但它的行为很奇怪我的解决方案包括遍历毕达哥拉斯树巴宁矩阵 https en wi
如何将xml解析为java对象？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个用于配置一些规则的XML 它没有复杂的结构但是这个配置在我的系统中的任何地方使用所以我想将此XML解析为java对象并设计
使用已删除的名称创建 Azure API 管理会导致名称“已在使用中”错误

我之前使用 Terraform 创建并随后删除了 Azure API 管理服务它消失在Azure Portal中几个小时后当我尝试使用相同名称重新创建 API 管理时我在 Azure 门户中收到此错误 name already in
R ranger 包中的预测概率

我正在尝试在 R 中建立一个具有随机森林分类的模型通过 Ned Horning 编辑代码我首先使用randomForest包但后来发现ranger 这保证了更快的计算首先我使用下面的代码在拟合模型后获得每个类别的预测概率rando
编译器如何为 C++ 中条件声明的自动变量分配内存？

假设我有一个函数根据某些运行时条件创建昂贵的自动对象或创建便宜的自动对象 void foo if runtimeCondition int x 0 else SuperLargeObject y 当编译器为此函数分配堆栈帧的内存时它是否

编译器如何为 C++ 中条件声明的自动变量分配内存？

ICC

GCC

Clang

编译器如何为 C++ 中条件声明的自动变量分配内存？ 的相关文章

随机推荐

热门标签

编译器如何为 C++ 中条件声明的自动变量分配内存？的相关文章