Linux内核系统调用原理与实现

2023-05-16

解决什么问题

Linux系统调用主要是操作系统实现的应用编程接口,简单的说就是linux内核提供对外(对于应用程序)的接口函数,进程通过调用系统调用完成自身的功能。
在这里插入图片描述
系统调用在每个平台的实现方式都不同相同,例如x86通过int 0x80中断来实现,arm通过其它的指令实现。

具体原理与实现

1 系统调用过程
对于内核提供给应用程序的接口,例如open接口,在内核中有对应的一个函数sys_open.
在这里插入图片描述
我们在内核增加一个系统调用,这里就是函数声明。
具体实现是通过系统调用相关的辅助宏来定义的。
在这里插入图片描述
内核中提供了一组宏来定义的,通过系统调用的参数个数来定义
open的3个参数,即就是SYSCALL_DEFINE3.
在这里插入图片描述
里面就是open的具体实现了。可以自己添加printk函数来编译通过查看打印信息。

对于系统调用的定义,我们可以将SYSCALL_DEFINE3宏展开,会得到代码
在这里插入图片描述
编译器自动生成代码比较复杂,但是主要就是生成两个gcc内置函数的安全性检查等,就跟sizeof和typeof一样只在编译时起作用。

type __builtin_choose_expr (const_exp, exp1, exp2)
__builtin_types_compatible_p(typeof(a), typeof(b))

把编译器生成的代码化简后并拼接上open实现代码就形成了open系统调用的最终代码。
在这里插入图片描述
2 为何可以调用
系统中维护了一个全局系统调用列表sys_call_table,以4k对齐
在这里插入图片描述
上面的是以arm64系统为例的,其它的每个硬件平台都有对应的一个全局系统调用表。
在这里插入图片描述
这样sys_open系统调用的入口就写入到sys_call_table列表中。

系统调用全过程

应用程序调用C库的open函数,C库执行80中断进入CPU异常模式,然后内核找到系统调用函数并执行它,最后返回到用户空间的一个过程。
1 程序调用C库执行open系统调用

#include <stdio.h>
#include <stdlib.h>
int main(int argc, const char *argv[])
{
        FILE *fp = fopen(".", "r");
        if (fp) fclose(fp);
        return 0;
}

执行编译命令:
在这里插入图片描述
执行反编译命令:
在这里插入图片描述
生成asm文件可以查看到.
c库将fopen自动转成了对openat的系统调用.
通过读汇编代码可以看到设置寄存器的系统调用号0x38存放在寄存器中,执行完系统调用后,程序将继续执行下一行代码。等待软中断触发。

2 cpu进入异常模式
程序执行c库的指令后,cpu进入异常模式。内核根据异常类型以及中断向量表里面的地址,调用同步异常处理例程。现在看看el0_sync代码
在这里插入图片描述
1 kernel_entry是一个汇编宏代码,做进入系统调用前的准备工作,包括保存程序执行的现场,载入与CPU核相关的线程数据,保存异常返回地址等。
2 读取系统寄存器esr_el1的值。异常不单单只有系统调用会触发,内存缺页、指令错误等也会触发,因此,esr_el1[26:31]就保存了异常发生的原因。
3 取出esr_el1中产生异常的原因,保存在x24里。
4 ARM定义系统调用的原因为ESR_ELx_EC_SVC64,把它与x24与比较,如果相等则执行系统调用的代码,如果不相等则需继续往下走,表明异常是由其他原因触发的,比如内存缺页等。
5 执行el0_svc系统调用的代码

3 找到系统调用函数并执行它
el0_sync函数是用来处理系统调用的,首先从系统全局唯一的系统调用表里,取得C库调用svc时准备的系统调用号,然后根据调用号索引找到系统调用表里相应的函数地址,最后执行它。
在这里插入图片描述
1 载入全局系统调用列表sys_call_table的地址。
2 取出系统调用号(w8即是x8的低32位寄存器),保存到scno(x26)里。系统调用号是C库代码在每个系统调用前写入x8寄存器里的。
3 获得全部系统调用的最大值并保存到sc_nr(x25)里。
4 比较系统调用号与最大值,结果保存在状态寄存器里。
5 比较的结果大于最大值,则跳到ni_sys处执行错误处理。
6 把系统调用号作为索引,取出sys_call_table表中相应的函数地址,这里保存的就是sys_open的地址。sys_open函数地址如何设置到sys_call_table表里请参考前一篇文章。
7 调用sys_open函数,完成此系统调用的功能。
4 返回用户空间
程序调用完sys_open函数后,系统调用的功能就执行完毕了,剩下的任务就是返回到程序的用户空间里,继续执行剩下的代码。
在这里插入图片描述
ret_fast_syscall函数,执行流返回到的用户空间里去。
1 关闭中断
2 系统调用的返回值保存进堆栈里。
3 kernel_exit是一个汇编宏与kernel_entry相对应,恢复之前程序执行的现场,设置异常返回地址,执行eret指令,返回到用户空间里去。

总结

1、应用程序调用
当程序调用C库打开一个文件的时候,把系统调用的参数放入x1-x6寄存器(系统调用最多用到6个参数),把系统调用号放在x8寄存器里,然后执行SVC指令,CPU进入EL1。

2 保持线程存入系统调用表 CPU把当前程序指针寄存器PC放入ELR_EL1里,把PSTATE放入SPSR_EL1里,把系统调用的原因放在ESR_EL1里,然后通过VBAR_EL1加上偏移量取得异常向量的入口地址,接着开始执行入口的第一行代码。这一过程是CPU自动完成的,不需要程序干预。

3 执行具体调用函数
内核保存异常发生时程序的执行现场,然后通过异常的原因及系统调用号找到系统调用的具体函数,接着执行函数,把返回值放入x0寄存器里。这一过程是内核实现的,每种操作系统可以有不同的实现。

4 返回应用程序
系统调用完成后,程序需要主动设置ELR_EL1和SPSR_EL1的值,原因是异常会发生嵌套,一旦发生异常嵌套ELR_EL1和SPSR_EL1的值就会随之发生改变,所以当系统调用返回时,需要恢复之前保存的ELR_EL1和SPSR_EL1的值。最后内核调用ERET命令,CPU自动把ELR_EL1写回PC,把SPSR_EL1写回PSTATE,并返回到EL0里。这时程序就返回到用户态继续运行了。
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Linux内核系统调用原理与实现 的相关文章

  • Ardupilot之cpu外设基础抽象聚合类 HAL.h

    libraries AP HAL HAL h 定义了所有外设的基础抽象类集合 一个 HAL 抽象类世界 xff0c 由 HAL 层的cpu外设的抽象类基础组件组聚而成 xff1b 也就是一个 HAL 派生类子对象 代表了一个 cpu 的所有
  • 一次Ajax报错:“存储空间不足,无法完成此操作”的解决经验

    连续几天我们收到几位客户的问题工单 xff0c 问题描述都类似 xff0c 都是在做登陆或者交易时报脚本错误 xff0c 交易无法正常执行 我们 远程协助 客户机器时 xff0c 调试发现都是ajax代码出错 xff0c 错误如下 xff1
  • Java异常的另类用法(一)

    异常在我们的代码中是不可避免的 xff0c 有些异常可以忽略 xff0c 多数的异常我们要显式处理 xff08 至少要记录日志 xff0c 以便后面排查问题 xff09 xff0c 这里我们不是要细说异常的处理规范 xff0c 而是使用异常
  • 使用POI在Excel单元格插入符号(Symbol)

    最近看到有人在 技术问答 上提问怎么用java在excel中插入打勾符号 xff1f 我想解决这个问题并不难 我们先打开一个excel文件 xff0c 在里面插入特定符号 xff0c 然后用poi xff08 其他的技术也可以 xff09
  • Eclipse下C语言的Socket编程(Winsock,gcc)问题总结

    最近心血来潮想从新温习一下C语言 xff08 工作后一直用Java xff0c 其实大学时C语言课程也没好好上 xff0c 正经的代码基本没写过 xff0c 惭愧啊 xff01 xff09 xff0c 找了些小例子 xff0c 修修改改 x
  • 各种哈希函数的java实现

    收集整理 public class HashUtils br private static final int crctab 61 0x00000000 0x77073096 0xee0e612c 0x990951ba br 0x076dc
  • libssl.so.10缺失库文件的解决办法

    libssl so 10缺失库文件的解决办法 在RHEL6 5中对openssl进行了升级 xff0c 如果老版本是OpenSSL 1 0 1e fips 那直接安装最新的openssl 1 0 1g 1 x86 64 rpm就行了 xff
  • Nvidia Jetson Nano入门与使用

    Pre xff1a Nvidia Nano板等了好久 xff0c 国内终于便宜了一点 刚从网上买一个 xff0c 准备替换掉Nvidia TX2开发板 xff08 因为目前的算法在Nano开发板上跑应该没有问题 xff09 打开包装 xff
  • 算法之路(四)----汉诺塔(又称河内之塔)

    汉诺塔是很简单也很经典的算法之一 汉诺塔是根据一个传说形成的数学问题 xff1a 有三根杆子A xff0c B xff0c C A杆上有N个 N gt 1 穿孔圆盘 xff0c 盘的尺寸由下到上依次变小 要求按下列规则将所有圆盘移至C杆 x
  • 相位一致性——利用频域检测边缘

    相位一致性 利用频域检测边缘 一 相位一致性提出的背景 相位一致性的提出是基于科学家发现了人感觉图像的关键不在于图像的长度差或者高度差之类的因素 xff0c 关键在于图像信号的相位大小 xff0c 例如人知道一个方波的边缘 xff0c 并不
  • 图像分割——掩膜法

    电路板是用掩膜法制作而成的 xff0c 现在电路板表面涂上一层抗腐蚀的材料 xff0c 然后再进行处理 xff0c 最后洗去材料就得到了电路 掩膜法在图像处理中的应用 xff1a 可用于分割图像中的特定部分 xff0c 关键在于怎么取膜 例
  • C++ 值传递、指针传递、引用传递详解

    具体内容源自 xff1a http www cnblogs com yanlingyin archive 2011 12 07 2278961 html 以下是简介 xff1a 值传递 xff1a 形参是实参的拷贝 xff0c 改变形参的值
  • MATLAB: 读取同一目录下的所有文件名并按时间排序

    用MATLAB测试图像处理算法的过程中 通常需要读入一个目录下的多张测试图片 可以根据文件命名规则来读入某个特定目录下的所有文件 但是相对比较麻烦 通过利用MATLAB自带的dir 可以先读入所有的文件名字 知道文件数量 而且不用知道文件的
  • 相机模型(Camera Model)

    Perspective Camera Model Perspective Camera Model 或 Pinhole Camera Model都是简单但是应用广泛的模型 xff0c 描述了将物体从3D世界坐标系转换 xff08 World
  • Solid Compression

    定义 Solid Compression是一种多文件的数据压缩方式 xff0c 其中所有未被压缩的文件是一个整体 xff0c 视为一个独立的data block 这样的文件称为solid archive 7z RAR压缩格式和tar bas
  • 区分AR、VR、MR、CR

    终极扫盲贴 xff1a VR AR MR CR到底如何区分 xff1f
  • (2016/02/19)多传感器数据融合算法---9轴惯性传感器

    2016年2月18日 传感器的原理 加速度计 xff1a 加速度计 我们可以把它想作一个圆球在一个方盒子中 假定这个盒子不在重力场中或者其他任何会影响球的位置的场中 xff0c 球处于盒子的正中央 你可以想象盒子在外太空中 xff0c 或远
  • 【tx2】——NVIDIA TX2--3--NVIDIA Jetson TX2 查看系统版本参数状态及重要指令

    NVIDIA Jetson TX2 查看系统参数状态 当前博主的TX2更新的版本为 xff1a Jetpack 3 3 cuda 9 0 252 cudnn7 0 opencv3 3 1 TensorRT4 0 2 系统内核 xff1a t
  • 训练深度学习模型时电脑自动重启

    文章目录 问题可能原因解决方案 问题 前面用自己的台式机利用GPU训练模型的时候 xff0c 电脑老是自动重启 xff0c 当时试了各种方法 xff0c 找了各种原因 电脑配置 电脑买的是二手的 xff0c xff08 强烈建议买新的 xf
  • 华为机试题[2017.8.23]

    题目 xff1a 给定一个正整数 xff0c 给出消除重复数字以后最大的整数 输入描述 xff1a 正整数 xff0c 注意考虑长整数 输出描述 xff1a 消除重复数字以后的最大整数 下面的好像有问题 xff0c 当输入是4325432时

随机推荐

  • Kubernetes(k8s)中dashboard的汉化

    1 访问服务器的http 192 168 110 133 8080 ui地址 xff0c 如下所示 xff1a 使用dashboard版本registry cn hangzhou aliyuncs com google containers
  • docker + Rancher + guacamole 容器环境搭建并配置vnc连接

    Rancher 43 guacamole 容器环境搭建 准备环境 xff1a docker ce 17 01 43 43 centos7 x 43 guacamole 最新版0 9 14 43 Rancher 搭建完成效果 xff1a 1
  • C语言习题(1)——字符串拷贝,去空格,奇偶抽取字符串

    1 字符串拷贝 作者 xff1a 一叶扁舟 作用 xff1a 字符串的拷贝 时间 xff1a 18 25 2017 5 1 include lt stdio h gt include lt string h gt include lt st
  • 基于安卓平台的滤镜功能相机

    1 1需求背景 爱美之心 xff0c 人皆有之 我们拍照是为了留住一个美好的瞬间 Android自带的相机拍照效果满足不了人们的爱美心理 xff0c 而且比较单一 xff1b 因此为了解决这个问题我们研 发 滤镜功能相机 滤镜功能相机主要基
  • 威廉·巴特勒·叶芝:“我们是最后的浪漫主义者”

    喜欢叶芝是一件很文艺的事情 叶芝的诗滋润了无数少男少女的情怀 在叶芝被茅德 冈 嫌弃的这一生中 我们不知道他是否曾经后悔 我感动了全世界 却感动不了你 但至少 他的诗 感动了后世无数人 题记 多少人曾爱你青春欢畅的时辰 爱慕你的美丽 假意或
  • Javassist即时编译技术,热修复核心与原理

    Java 字节码以二进制的形式存储在 class 文件中 xff0c 每一个 class 文件包含一个Java类或接口 Javaassist 框架就是一个用来处理 Java 字节码的类库 它可以在一个已经编译好的类中添加新的方法 xff0c
  • ubuntu系统编译安装

    Ubuntu程序安装是个很好理解的 xff0c 这里我发表一下个人理解 xff0c 下面就这就来讲术Ubuntu编译安装 Ubuntu编译程序新手指导Ubuntu 团队对它的使用者公开的承诺 Ubuntu 永远免费 并且对于 34 企业版本
  • Android Launcher浅析(一)

    Launcher桌面的一大功能就是支持左右滑动 xff0c 这样的功能在现在的应用中使用非常广泛 xff0c 并且有很多实现的方式 xff0c 可以通过使用Fragment来实现也可以通过自定义的控件来实现 Launcher采用了后者 xf
  • Android OTA升级

    1 xff0c Build otapackage后system img没有打包进去 xff1f Ota包里面缺失system img xff0c 原因是客户修改了prop里面的 ro product device value值 尝试以下两种
  • Android Launcher浅析(三)

    Launcher是系统启动后第一个启动的程序 是其它应用程序的入口 也就是我们的手机程序的桌面程序 一 Launcher的定义及构成 xff1a lt 1 gt 通过查看官方提供的Launcher源码可以知道其实Launcher也是一个Ac
  • 在Java中,return null 是否安全, 为什么?

    Java代码中return value 为null 是不是在任何情况下都可以 xff0c 为什么不会throw NullPointerException Java语言层面 xff1a null值自身是不会引起任何问题的 它安安静静的待在某个
  • 有一个文科女友是一场怎样的体验?

    1 我是一枚标准的工科男 xff0c 毕业后变成了加班狗程序猿 xff0c 我的女朋友是一枚标准的文科妹子 xff0c 这里姑且叫她miss梁吧 xff0c 我觉得以她的智商来看 xff0c 她应该是单细胞动物 xff0c 但是不知道她是怎
  • activity的startActivity和context的startActivity区别

    我们以 startActivity Intent 这个最常用的 api 来讲 1 首先 xff0c Context 类有一个 abstract 方法 Same as 64 link startActivity Intent Bundle w
  • android平台下移动DM接入流程?

    中国移动拟建设终端管理与服务系统 通过对终端产品的激活 配置使用等信息的收集 结合终端公司对产品的供应链管理 实现产品全生命周期的掌控 要求2017年3月起 所有入中国移动产品库的定制 非定制Android终端均要支持终端管理功能 必选要求
  • C++经典面试题(九)

    最近看一些面试题 xff0c 觉得如果自己被问到了 xff0c 并不能很利落的回答出来 一是从来没有这个意识 xff0c 二是没有认真的梳理下 下面对这些题做出分析 xff0c 哈 xff01 个人能力有限 xff0c 其中难免有疏漏 xf
  • 我的大学——学习生活总结

    纪念我终将逝去的青春 大一上學期 專業 1 C語言K amp R amp amp 習題 2 C語言經典習題 3 C語言趣味習題 4 C陷阱与缺陷 5 彙編語言 6 C 43 43 程序設計 7 C 程序設計
  • latex论文作图(python+matplotlib)

    20210425 0 引言 论文中进行作图 xff0c 需要对图片中的各种元素进行控制 xff0c 最近在论文写作过程中为了能够得到匹配文章的高质量图片 xff0c 也是花了很多心血 除了对图片中的风格进行控制 xff0c 另一方面比较重要
  • SAP结转方法:表结法、帐结法

    SAP 处理会计期间结帐方法主要有两种方法 xff1a 表结法和帐结法 国内在会计期末结帐大都采用 帐结 的方法 xff0c 而 SAP 一般都是采用 表 结 xff0c 通过财务报表的编制来披露当期利润 xff0c 即 xff1a 销售科
  • V4L2读取摄像头YUYV(YUV420)帧后使用C语言转存为bmp格式

    摄像头配置读取一帧YUV420 xff08 YUYV xff09 保存为RGB24图像 BRG的顺序 xff0c bmp 下面是内存中摄像头读取的数据直接转存为RGB图片的源码 输入 xff1a 图像指针地址 xff0c 图像长度 xff0
  • Linux内核系统调用原理与实现

    解决什么问题 Linux系统调用主要是操作系统实现的应用编程接口 xff0c 简单的说就是linux内核提供对外 对于应用程序 的接口函数 xff0c 进程通过调用系统调用完成自身的功能 系统调用在每个平台的实现方式都不同相同 xff0c