为什么我可以使用 ret 退出 main？

2024-05-01

我即将弄清楚程序堆栈到底是如何设置的。我了解到用以下方式调用该函数

call pointer;

实际上等同于：

mov register, pc ;programcounter
add register, 1 ; where 1 is one instruction not 1 byte ...
push register
jump pointer

然而，这意味着当 Unix 内核调用 main 函数时，堆栈基址应该指向调用 main 的内核函数的重入。

因此，在 C 代码中跳转“*rbp-1”应该重新进入主函数。

然而，这并不是以下代码中发生的情况：

#include <stdlib.h>
#include <unistd.h>

extern void ** rbp(); //pointer to stack pointing to function
int main() {
   void ** p = rbp();
   printf("Main: %p\n", main);
   printf("&Main: %p\n", &main); //WTF
   printf("*Main: %p\n", *main); //WTF
   printf("Stackbasepointer: %p\n", p);
   int (*c)(void) = (*p)-4;
   asm("movq %rax, 0");
   c();

   return 0;        //should never be executed...

}

汇编文件：rsp.asm

...

.intel_syntax

.text:

.global _rbp

_rbp:
  mov rax, rbp
  ret;

不出所料，这是不允许的，也许是因为此时的指令不完全是 64 位，也许是因为 UNIX 不允许这样做......

But also不允许此调用：

   void (*c)(void) = (*p);
   asm("movq %rax, 0"); //Exit code is 11, so now it should be 0
   c(); //this comes with stack corruption, when successful

这意味着我没有义务退出主调用函数。

我的问题是：为什么当我在每个 GCC 主函数末尾使用 ret 时，它的作用应该与上面的代码相同。 UNIX 系统如何有效地检查此类尝试...... 我希望我的问题很清楚......

谢谢。 P.S.：代码仅在 macOS 上编译，请更改 Linux 的程序集

C main从 CRT 启动代码（间接）调用，而不是直接从内核调用。

After main返回，该代码调用atexit函数执行诸如刷新 stdio 缓冲区之类的操作，然后将 main 的返回值传递给原始值_exit系统调用。或者exit_group它退出所有线程。

您做出了几个错误的假设，我认为这些假设都是基于对内核工作原理的误解。

内核以与用户空间不同的权限级别运行（x86 上的环 0 与环 3）。即使用户空间知道要跳转到的正确地址，它也无法跳转到内核代码。（即使可以，它也不会与内核一起运行特权级别).

ret isn't magic, it's basically just pop %rip and doesn't let you jump anywhere you couldn't jump to with other instructions. Also doesn't change privilege level¹.
当用户空间代码运行时，内核地址无法映射/访问；这些页表条目被标记为仅限主管。（或者它们根本没有映射到缓解 Meltdown 漏洞的内核中，因此进入内核会经过一个更改 CR3 的“包装”代码块。）

虚拟内存是内核保护自身免受用户空间影响的方式。用户空间不能直接修改页表，只能通过请求内核来完成mmap and mprotect系统调用。（并且用户空间无法执行特权指令，例如mov cr3, rax安装新的页表。这就是设置环 0（内核模式）与环 3（用户模式）的目的。）
对于进程来说，内核堆栈与用户空间堆栈是分开的。（在内核中，每个任务（也称为线程）还有一个小的内核堆栈，在用户空间线程运行时在系统调用/中断期间使用。至少 Linux 是这样做的，不知道其他的。）
内核并不是字面上的意思call用户空间代码；用户空间堆栈不会将任何返回地址保留回内核。内核->用户转换涉及交换堆栈指针以及更改特权级别。例如用类似的指令iret https://www.felixcloutier.com/x86/iret:iretd（中断返回）。

另外，将内核代码地址留在用户空间可以看到的任何地方都会破坏内核 ASLR。

脚注 1：（编译器生成的ret永远是正常的附近ret, not a retf可以通过调用门或其他方式返回给特权者cs价值。 x86 通过 CS 的低 2 位处理权限级别，但没关系。 MacOS / Linuxdon't设置用户空间可以用来调用内核的调用门；完成了syscall or int 0x80指示。）

在一个新鲜的过程中（经过execve系统调用用新的 PID 替换了前一个进程），执行从进程入口点开始（通常标记为_start), not在Cmain直接运行。

C 实现附带 CRT（C 运行时）启动代码，该代码（除其他外）有一个手写的 asm 实现_start（间接）调用main，根据调用约定将 args 传递给 main。

_start本身不是一个函数。在流程输入时，RSP 指向argc，上面的用户空间堆栈上是argv[0], argv[1]等（即char *argv[]数组按值就在那里，上面是envp大批。）_start loads argc放入寄存器并将指向 argv 和 envp 的指针放入寄存器中。（MacOS 和 Linux 都使用的 x86-64 System V ABI 记录了所有这些，包括进程启动环境和调用约定。)

If you try to ret from _start，你就会弹出argc进入RIP，然后从绝对地址取码1 or 2（或其他少量）将出现段错误。例如，_start 中 RET 上的 Nasm 分段错误 https://stackoverflow.com/questions/19760002/nasm-segmentation-fault-on-ret-in-start表明尝试ret从进程入口点（链接withoutCRT 启动代码）。它有一个手写的_start刚刚落入main.

当你跑步时gcc main.c, the gcc前端运行多个其他程序（使用gcc -v以显示详细信息）。这就是 CRT 启动代码链接到您的进程的方式：

gcc 预处理器 (CPP) 和编译+程序集main.c to main.o（或临时文件）。在 MacOS 上，gcc命令实际上是 clang，它有一个内置的汇编器，但是真实的gcc确实编译成asm然后运行as关于这一点。（不过，C 预处理器内置于编译器中。）
gcc 运行类似的东西ld -dynamic-linker /lib64/ld-linux-x86-64.so.2 -pie /usr/lib/Scrt1.o /usr/lib/gcc/x86_64-pc-linux-gnu/9.1.0/crtbeginS.o main.o -lc -lgcc /usr/lib/gcc/x86_64-pc-linux-gnu/9.1.0/crtendS.o。这实际上是简化的a lot，省略了一些 CRT 文件，并对路径进行了规范化以删除../../lib部分。另外，它不运行ld直接运行collect2这是一个包装器ld。但无论如何，静态链接在那些.oCRT 文件包含_start和其他一些东西，并动态链接 libc (-lc）和 libgcc （用于 GCC 辅助函数，例如实现__int128使用 64 位寄存器进行乘法和除法（如果您的程序使用这些寄存器）。

.intel_syntax

.text:

.global _rbp

_rbp:
  mov rax, rbp
  ret;

这是不允许的，...

不组装的唯一原因是因为你试图声明.text:作为标签，而不是使用.text 指示。如果删除尾随:它确实用 clang 进行组装（它对待.intel_syntax与.intel_syntax noprefix).

对于 GCC / GAS 来组装它，您还需要noprefix告诉它寄存器名称没有前缀%。（是的，就是你can有 Intel op dst、src 顺序，但仍然有%rsp注册名称。没有你不应该这样做！）当然，GNU/Linux 不使用前导下划线。

不过，如果你调用它，它并不总是会做你想做的事！如果你编译了main没有优化（所以-fno-omit-frame-pointer有效），那么是的，您会得到一个指向返回地址下方堆栈槽的指针。

而且你肯定错误地使用了该值. (*p)-4;加载保存的 RBP 值（*p)，然后偏移四个 8 字节空指针。（因为这就是 C 指针数学的工作原理；*p有类型void*因为p有类型void **).

我认为您正在尝试获取自己的返回地址并重新运行call指令（在 main 的调用者中）到达 main，最终因推送更多返回地址而导致堆栈溢出。在 GNU C 中，使用void * __builtin_return_address (0) 获取您自己的退货地址 https://gcc.gnu.org/onlinedocs/gcc/Return-Address.html.

x86 call rel32指令是5个字节，但是call调用 main 可能是间接调用，使用寄存器中的指针。所以它可能是一个2字节call *%rax或 3 字节call *%r12，除非你反汇编你的调用者，否则你不知道。（我建议按指令单步执行（GDB / LLDBstepi）结束main在反汇编模式下使用调试器。如果它有 main 调用者的任何符号信息，您将能够向后滚动并查看上一条指令是什么。

如果没有，你可能必须尝试看看什么看起来是正常的； x86 机器代码无法明确地向后解码，因为它是可变长度的。您无法区分指令中的字节（例如立即数或 ModRM）与指令的开头之间的区别。这完全取决于你在哪里start拆解自.如果您尝试几个字节偏移，通常只有一个会产生看起来正常的结果。

   asm("movq %rax, 0"); //Exit code is 11, so now it should be 0

这是 RAX 到绝对地址的存储0, 在 AT&T 语法中。这当然会出现段错误。退出代码 11 来自 SIGSEGV，即信号 11。（使用kill -l查看信号编号）。

也许你想要mov $0, %eax。尽管这在这里仍然毫无意义，但您将通过函数指针进行调用。在调试模式下，编译器可能会将其加载到 RAX 中并逐步执行您的值。

另外，在一个寄存器中写入一个asm当您不告诉编译器您正在修改哪些寄存器（使用约束）时，语句永远不会安全。

   printf("Main: %p\n", main);
   printf("&Main: %p\n", &main); //WTF

main and &main是同一件事，因为main是一个函数。这就是 C 语法对函数名称的作用。main不是一个可以获取其地址的对象。

数组的情况类似：数组的裸名称可以分配给指针或作为指针 arg 传递给函数。但&array也是同一个指针，同&array[0]。这仅适用于arrays like int array[10]，不适用于像这样的指针int *ptr;在后一种情况下，指针对象本身具有存储空间并且可以获取其自己的地址。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我可以使用 ret 退出 main？的相关文章

高级 Win32 图像文件 I/O？

我想在 Windows C 应用程序中将图像文件读入内存什么是一个相当简单的解决方案也许类似于 IOS 提供的UIImage 我希望支持合理数量的文件格式我需要为图像处理的位图提供一些低级访问权限我在互联网上阅读了很多内容看起来
LINQ to XML - 如何正确使用 XDocument

现在我首先要说的是这确实是一项任务然而在我遇到 Linq to XML 语法之前我几乎已经完成了它我有 2 个课程曲目和 CD 现在作为作业的一部分我创建了一张 CD 然后向其中添加了一些曲目在搜索了大量完美解释了如何从 x
将 2D 数组映射到 1D 数组

我想用一维数组来表示一个二维数组函数将传递两个索引 x y 和要存储的值这两个索引代表一维数组的单个元素并相应地设置它我知道一维数组需要具有 arrayWidth arrayHeight 的大小但我不知道如何设置每个元素例如如
如何在 C# 事件中区分更改是由代码还是由用户进行？

我有一个简单的TextBox一开始是空的我有一个简单的事件 TextChanged 可以知道用户何时更改了其中的任何内容TextBox 但是如果我自己在代码中对其执行任何操作该事件就会触发喜欢设置textbox Text Test
处理 LINQ sum 表达式中的 null

我正在使用 LINQ 查询来查找列的总和并且在少数情况下该值有可能为空我现在使用的查询是 int score dbContext domainmaps Where p gt p SchoolId schoolid Sum v gt v
在 Windows Phone 上启动 pdf 文件时出现 System.Runtime.InteropServices.COMException

我正在尝试使用我之前在另一个应用程序上使用过的以下工作代码打开 pdf 文件但这一次当流程到达此行时我收到 System Runtime InteropServices COMException Windows System Laun
对数字进行向上和向下舍入 C++

我试图让我的程序分别向上和向下舍入数字例如如果数字是3 6 我的程序应该四舍五入最接近的数字 4 如果该数字是3 4 它将向下舍入为 3 我尝试使用ceil库获取 3 个项目的平均值 results ceil marks1 marks2
glDrawElements 只绘制半个四边形

这是我的功能 void Object draw2 if mIsInitialised return Tell OpenGL about our vertex and normal data glEnableClientState GL VE
如何检测斑点并将其裁剪成 png 文件？

我一直在开发一个网络应用程序我陷入了一个有问题的问题我会尝试解释我想要做什么在这里您看到第一个大图像其中有绿色形状我想要做的是将这些形状裁剪成不同的 png 文件并使它们的背景透明就像大图像下面的示例裁剪图像一样第一张图像将
如何在不使用reinterpret_cast的情况下使用dlsym()加载函数？

我正在尝试使用 clang tidy 来强制执行 C 核心指南虽然它确实有很多有效点但有一件事我无法真正解决 dlsym 返回一个void 我需要以某种方式将其转换为正确的函数指针为此我使用reinterpret cast 由于指南
当格式字符串包含“{”时，String.Format 异常

我正在使用 VSTS 2008 C Net 2 0 执行以下语句时 String Format 语句抛出 FormatException 有什么想法是错误的吗这是获取我正在使用的 template html 的位置我想在 templat
在生产者-消费者情况下使用条件变量

我正在尝试了解条件变量以及如何在生产者消费者情况下使用它我有一个队列其中一个线程将数字推入队列而另一个线程从队列中弹出数字当生产线程放置一些数据时我想使用条件变量向消费线程发出信号问题是有时或大多数时候它只将最多两个项目推
抽象类和接口之间的区别[重复]

这个问题在这里已经有答案了可能的重复接口与基类 https stackoverflow com questions 56867 interface vs base class 我不明白抽象类和接口之间的区别我什么时候需要使用哪种字体
在可观察项目生成时对其进行处理

我有一个IObservable它会生成一次性物品并且在其生命周期内可能会生成无限数量的物品因此我想在每次生成新项目时处理最后一个项目因此Using http reactivex io documentation operators
使用 Linq 进行异步Where过滤

我有一个List通过填充的元素async调用 WebService 没问题我需要过滤该列表以便在应用程序视图上显示某些内容我试过这个 List
使用 AutoMapper 进行 LINQ GroupBy 聚合

试图让查询工作但老实说不确定如何或者是否可能进行它因为我尝试过的一切都不起作用共查询6个表 Person PersonVote PersonCategory Category City FirstAdminDivision Per
编写专门用于类及其子类的函数模板

我正在尝试编写一个函数模板一个版本应该用于不满足另一版本标准的所有类型当参数是给定类的基类或该类本身时应使用另一个版本我尝试过超载Base 但是当类派生自Base 他们使用通用的而不是特定的我也尝试过这种 SFINAE 方法 s
OpenMP C 程序运行速度比顺序代码慢

我是 OpenMP 的新手正在尝试并行化 Jarvis 的算法然而事实证明与顺序代码相比并行程序花费的时间要长 2 3 倍难道问题本身就不能并行化吗或者我并行化它的方式有问题这是我针对该问题的 openMP 程序其中有 2
改进C++逐行读取文件的能力？

我正在解析大约 500GB 的日志文件我的 C 版本需要 3 5 分钟我的 Go 版本需要 1 2 分钟我正在使用 C 的流来流式传输文件的每一行以进行解析 include
SSBO 是更大的 UBO？

我目前正在 OpenGL 4 3 中使用 UBO 进行渲染以将所有常量数据存储在 GPU 上诸如材料描述矩阵等内容它可以工作但是 UBO 的小尺寸我的实现为 64kB 迫使我多次切换缓冲区减慢渲染速度我正在寻找类似的方法来存

随机推荐

自定义 web.config 部分处理程序

我之前设计过一个自定义部分处理程序但我遇到了一个我似乎无法想到的问题我有一个像这样的配置部分
什么时候使用 IoC 合适？

我了解 IoC 容器是什么并且一直在阅读结构图这项技术似乎很容易使用我的问题是使用 IoC 容器的适当粒度级别是多少我认为 IoC 的应用可能有以下级别打破所有对象之间的所有依赖关系当然有点过分了打破所有主要对象例如域对象
MongoDB：在没有并行性的情况下使用 MapReduce 有什么意义？

Quoting http www mongodb org display DOCS MapReduce MapReduce Parallelism http www mongodb org display DOCS MapReduce Ma
无法在 Docker 下运行 AWS SAM CLI

我正在尝试创建一个 Docker 镜像AWS SAM CLI https github com awslabs aws sam cli 但调用任何函数都会出现错误无法导入模块 index 我可以在 Docker 之外成功运行相同的测试用例
如何在Android应用程序中添加g729编解码器？

我正在开发一个用于拨打和接听电话的 SIP 应用程序我想在我的应用程序中添加 G729 编解码器目前我正在对开源项目进行分析SipDroid http code google com p sipdroid 如果我想让该应用程序支持 G7
ggplot2 每个方面的不同因子顺序

我正在尝试创建一个克利夫兰点图在本例中为 J 和 K 给出两个类别问题是元素 A B C 都在这两个类别中所以 R 一直放屁我做了一个简单的例子 x lt c LETTERS 1 10 LETTERS 1 3 LETTERS 11
如何以编程方式停止/退出/终止 dotnet core HostBuilder 控制台应用程序？

我正在尝试创建一个 dotnet 核心控制台应用程序该应用程序是一个简单的实用程序应用程序应该启动执行其操作并退出使用 Visual Studio 生成的标准控制台应用程序模板可以轻松实现但现在我们有了 HostBuilder 它
提取字符串中最后一个句点后的文本[重复]

这个问题在这里已经有答案了我意识到这个问题对于大多数正则表达式大师来说可能看起来非常简单但是回顾类似的问题并没有得出解决方案我有一个电子邮件地址向量称为email并希望在每个最后一个句点之后提取文本举例来说 email lt c
[BotFramework]：如何修复：在 V4 中开发的 C# WebChatBot 中，欢迎消息未向用户显示，但在模拟器中显示？
数组中 2 个百分位之间的平均元素

我有 2 个长度为 200 的向量例如 A 和 B 然后我使用以下方法找到数组 A 的每第二个百分位数 A1 prctile A 1 2 100 1 这样A1是一个长度为50的数组现在我想找到A1中每两个元素内的A元素的平均值即A的第
强制 Access 忘记链接表的用户名和密码

我有一个通过链接服务器连接到 SQL Server 的 MS Access 数据库链接表是使用修改后的添加的AttachDSNLessTable程序 stConnect ODBC DRIVER stDriverName SERVER st
Slick中的动态查询参数（排序）

我正在尝试将异常查询转换为平滑查询Play 2 3 示例之一 https github com playframework playframework tree 2 3 x samples scala computer database 但
Pyspark 可为空的 uuid 类型 uuid 但表达式的类型为字符变化

给定一个表格设计不可为 null 的 uuid列和a可为空的 uuid列如何使用 python 3 7 9 与 Pyspark 2 4 3 数据帧和 postgresql 42 2 18 jar 驱动程序进行插入 table df spa
验证错误消息中不包含字段名称

如果我有以下验证 validates inclusion of dob in gt Date new 1900 Time now years ago 18 to date message gt You must be 18 or older
从 Linux 内核模块的文件描述符获取文件名/路径？

在Linux内核模块中有没有一种方法可以从文件名路径中获取文件名路径 unsigned int fd 我知道这个答案如何从内核模块内的文件描述符获取文件名 https stackoverflow com questions 8250
抑制SQL Server SSDT中的一些警告

In SQL Server 数据工具 http msdn microsoft com en us library hh272686 我想抑制某些但不是全部 SQL71502 的出现具有对对象的未解析引用我知道我可以通过项目属性构建抑
为什么组合器输入记录的数量比映射的输出数量多？

Combiner 在 Mapper 之后 Reducer 之前运行它将接收给定节点上的 Mapper 实例发出的所有数据作为输入然后它将输出发送到Reducers 因此组合器输入的记录应小于映射输出的记录 12 08 29 13 38
使用 Powershell 按列拆分 csv 文件

我是 powershell 的新手但这看起来是完成此任务的最佳工具有一个如下所示的 csv 文件 Date mary1 mary2 maryr3 mary4 9 01 2011 1 00 1 39 3 43 3 29 1 83 9 01
定制 odoo 中的会计和财务模块？

我正在研究会计和财务模块我想做一些修改例如隐藏字段和隐藏税收图表有人能帮我吗请告诉我隐藏左侧菜单项税表的程序我也想知道view id隐藏发票表中的税费和底部税费更新请让我知道隐藏它们的外部 ID 我无法找到它们因为它们链
为什么我可以使用 ret 退出 main？

我即将弄清楚程序堆栈到底是如何设置的我了解到用以下方式调用该函数 call pointer 实际上等同于 mov register pc programcounter add register 1 where 1 is one instr

为什么我可以使用 ret 退出 main？

为什么我可以使用 ret 退出 main？ 的相关文章

随机推荐

热门标签

为什么我可以使用 ret 退出 main？的相关文章