内存保护linux指令,Linux内存管理之MMU的过程

2023-11-03

之前写过一篇《CPU是如何访问内存的?》的文章,简单介绍了cpu访问内存的过程。有了之前的感性认识,这篇站在arm的角度再深度讲解一下,看完你会发现不理解arm原理就直接撸内核代码简直是耍流氓。

ARMv8中的访问内存流程

我喜欢用图的方式来说明问题,简单直接:

7193bbb8ed51a7ed6801dd07a4fdfb11.png

蓝色部分是cpu,灰色部分是内存,白色部分就是cpu访问内存的过程,也是地址转换的过程。在解释地址转换的本质前我们先理解下几个概念:

TLB:MMU工作的过程就是查询页表的过程。如果把页表放在内存中查询的时候开销太大,因此为了提高查找效率,专门用一小片访问更快的区域存放地址转换条目。(当页表内容有变化的时候,需要清除TLB,以防止地址映射出错。)

Caches:cpu和内存之间的缓存机制,用于提高访问速率,armv8架构的话上图的caches其实是L2 Cache,这里就不做进一步解释了。

「那么CPU是如何通过MMU和Cache来访问内存的呢?」

ba712805e1ecaabae9885e942785a8bb.png

可以看出虚拟地址和物理地址的转换关键是过程Table Walk Unit。

虚拟地址转换为物理地址的本质

我们知道内核中的寻址空间大小是由CONFIG_ARM64_VA_BITS控制的,这里以48位为例,ARMv8中,Kernel Space的页表基地址存放在TTBR1_EL1寄存器中,User Space页表基地址存放在TTBR0_EL0寄存器中,其中内核地址空间的高位为全1,(0xFFFF0000_00000000 ~ 0xFFFFFFFF_FFFFFFFF),用户地址空间的高位为全0,(0x00000000_00000000 ~ 0x0000FFFF_FFFFFFFF)

c45118ca93ee1408635cee8374e89fba.png

有了宏观概念,下面我们以内核态寻址过程为例看下是如何把虚拟地址转换为物理地址的。

我们知道linux采用了分页机制,通常采用四级页表,页全局目录(PGD),页上级目录(PUD),页中间目录(PMD),页表(PTE)。如下:

ed689909e8ddc269cd20ca384674ee8d.png

从CR3寄存器中读取页目录所在物理页面的基址(即所谓的页目录基址),从线性地址的第一部分获取页目录项的索引,两者相加得到页目录项的物理地址。

第一次读取内存得到pgd_t结构的目录项,从中取出物理页基址取出,即页上级页目录的物理基地址。

从线性地址的第二部分中取出页上级目录项的索引,与页上级目录基地址相加得到页上级目录项的物理地址。

第二次读取内存得到pud_t结构的目录项,从中取出页中间目录的物理基地址。

从线性地址的第三部分中取出页中间目录项的索引,与页中间目录基址相加得到页中间目录项的物理地址。

第三次读取内存得到pmd_t结构的目录项,从中取出页表的物理基地址。

从线性地址的第四部分中取出页表项的索引,与页表基址相加得到页表项的物理地址。

第四次读取内存得到pte_t结构的目录项,从中取出物理页的基地址。

从线性地址的第五部分中取出物理页内偏移量,与物理页基址相加得到最终的物理地址。

第五次读取内存得到最终要访问的数据。

整个过程是比较机械的,每次转换先获取物理页基地址,再从线性地址中获取索引,合成物理地址后再访问内存。不管是页表还是要访问的数据都是以页为单位存放在主存中的,因此每次访问内存时都要先获得基址,再通过索引(或偏移)在页内访问数据,因此可以将线性地址看作是若干个索引的集合。

linux中对地址转换的实现

/*描述各级页表中的页表项*/

typedef struct { pteval_t pte; } pte_t;

typedef struct { pmdval_t pmd; } pmd_t;

typedef struct { pudval_t pud; } pud_t;

typedef struct { pgdval_t pgd; } pgd_t;

/* 将页表项类型转换成无符号类型 */

#define pte_val(x)((x).pte)

#define pmd_val(x)((x).pmd)

#define pud_val(x)((x).pud)

#define pgd_val(x)((x).pgd)

/* 将无符号类型转换成页表项类型 */

#define __pte(x)((pte_t) { (x) } )

#define __pmd(x)((pmd_t) { (x) } )

#define __pud(x)((pud_t) { (x) } )

#define __pgd(x)((pgd_t) { (x) } )

/* 获取页表项的索引值 */

#define pgd_index(addr)(((addr) >> PGDIR_SHIFT) & (PTRS_PER_PGD - 1))

#define pud_index(addr)(((addr) >> PUD_SHIFT) & (PTRS_PER_PUD - 1))

#define pmd_index(addr)(((addr) >> PMD_SHIFT) & (PTRS_PER_PMD - 1))

#define pte_index(addr)(((addr) >> PAGE_SHIFT) & (PTRS_PER_PTE - 1))

/* 获取页表中entry的偏移值 */

#define pgd_offset(mm, addr)(pgd_offset_raw((mm)->pgd, (addr)))

#define pgd_offset_k(addr)pgd_offset(&init_mm, addr)

#define pud_offset_phys(dir, addr)(pgd_page_paddr(*(dir)) + pud_index(addr) * sizeof(pud_t))

#define pud_offset(dir, addr)((pud_t *)__va(pud_offset_phys((dir), (addr))))

#define pmd_offset_phys(dir, addr)(pud_page_paddr(*(dir)) + pmd_index(addr) * sizeof(pmd_t))

#define pmd_offset(dir, addr)((pmd_t *)__va(pmd_offset_phys((dir), (addr))))

#define pte_offset_phys(dir,addr)(pmd_page_paddr(READ_ONCE(*(dir))) + pte_index(addr) * sizeof(pte_t))

#define pte_offset_kernel(dir,addr)((pte_t *)__va(pte_offset_phys((dir), (addr))))

进程在切换的时候就是根据task_struct找到mm_struct里的PGD字段,取得新进程的页全局目录,然后填充到CR3寄存器,就完成了页的切换。

下面我们动手操作一下,通过代码来深度理解下虚拟地址是如何转化为物理地址的。

#include

#include

#include

#include

#include

#include

#include

#include

MODULE_DESCRIPTION("vitual address to physics address");

static int pid;

static unsigned long va;

module_param(pid,int,0644); //从命令行传递参数(变量,类型,权限)

module_param(va,ulong,0644); //va表示的是虚拟地址

static int find_pgd_init(void)

{

unsigned long pa = 0; //pa表示的物理地址

struct task_struct *pcb_tmp = NULL;

pgd_t *pgd_tmp = NULL;

pud_t *pud_tmp = NULL;

pmd_t *pmd_tmp = NULL;

pte_t *pte_tmp = NULL;

printk(KERN_INFO"PAGE_OFFSET = 0x%lx\n",PAGE_OFFSET); //页表中有多少个项

/*pud和pmd等等 在线性地址中占据多少位*/

printk(KERN_INFO"PGDIR_SHIFT = %d\n",PGDIR_SHIFT);

//注意:在32位系统中 PGD和PUD是相同的

printk(KERN_INFO"PUD_SHIFT = %d\n",PUD_SHIFT);

printk(KERN_INFO"PMD_SHIFT = %d\n",PMD_SHIFT);

printk(KERN_INFO"PAGE_SHIFT = %d\n",PAGE_SHIFT);

printk(KERN_INFO"PTRS_PER_PGD = %d\n",PTRS_PER_PGD); //每个PGD里面有多少个ptrs

printk(KERN_INFO"PTRS_PER_PUD = %d\n",PTRS_PER_PUD);

printk(KERN_INFO"PTRS_PER_PMD = %d\n",PTRS_PER_PMD); //PMD中有多少个项

printk(KERN_INFO"PTRS_PER_PTE = %d\n",PTRS_PER_PTE);

printk(KERN_INFO"PAGE_MASK = 0x%lx\n",PAGE_MASK); //页的掩码

struct pid *p = NULL;

p = find_vpid(pid); //通过进程的pid号数字找到struct pid的结构体

pcb_tmp = pid_task(p,PIDTYPE_PID); //通过pid的结构体找到进程的task struct

printk(KERN_INFO"pgd = 0x%p\n",pcb_tmp->mm->pgd);

// 判断给出的地址va是否合法(va<vm_end)

if(!find_vma(pcb_tmp->mm,va)){

printk(KERN_INFO"virt_addr 0x%lx not available.\n",va);

return 0;

}

pgd_tmp = pgd_offset(pcb_tmp->mm,va); //返回线性地址va,在页全局目录中对应表项的线性地址

printk(KERN_INFO"pgd_tmp = 0x%p\n",pgd_tmp);

//pgd_val获得pgd_tmp所指的页全局目录项

//pgd_val是将pgd_tmp中的值打印出来

printk(KERN_INFO"pgd_val(*pgd_tmp) = 0x%lx\n",pgd_val(*pgd_tmp));

if(pgd_none(*pgd_tmp)){ //判断pgd有没有映射

printk(KERN_INFO"Not mapped in pgd.\n");

return 0;

}

pud_tmp = pud_offset(pgd_tmp,va); //返回va对应的页上级目录项的线性地址

printk(KERN_INFO"pud_tmp = 0x%p\n",pud_tmp);

printk(KERN_INFO"pud_val(*pud_tmp) = 0x%lx\n",pud_val(*pud_tmp));

if(pud_none(*pud_tmp)){

printk(KERN_INFO"Not mapped in pud.\n");

return 0;

}

pmd_tmp = pmd_offset(pud_tmp,va); //返回va在页中间目录中对应表项的线性地址

printk(KERN_INFO"pmd_tmp = 0x%p\n",pmd_tmp);

printk(KERN_INFO"pmd_val(*pmd_tmp) = 0x%lx\n",pmd_val(*pmd_tmp));

if(pmd_none(*pmd_tmp)){

printk(KERN_INFO"Not mapped in pmd.\n");

return 0;

}

//在这里,把原来的pte_offset_map()改成了pte_offset_kernel

pte_tmp = pte_offset_kernel(pmd_tmp,va); //pte指的是 找到表

printk(KERN_INFO"pte_tmp = 0x%p\n",pte_tmp);

printk(KERN_INFO"pte_val(*pte_tmp) = 0x%lx\n",pte_val(*pte_tmp));

if(pte_none(*pte_tmp)){ //判断有没有映射

printk(KERN_INFO"Not mapped in pte.\n");

return 0;

}

if(!pte_present(*pte_tmp)){

printk(KERN_INFO"pte not in RAM.\n");

return 0;

}

pa = (pte_val(*pte_tmp) & PAGE_MASK) ;//物理地址的计算方法

printk(KERN_INFO"virt_addr 0x%lx in RAM Page is 0x%lx .\n",va,pa);

//printk(KERN_INFO"contect in 0x%lx is 0x%lx\n",pa,*(unsigned long *)((char *)pa + PAGE_OFFSET));

return 0;

}

static void __exit find_pgd_exit(void)

{

printk(KERN_INFO"Goodbye!\n");

}

module_init(find_pgd_init);

module_exit(find_pgd_exit);

MODULE_LICENSE("GPL");

运行结果如下:

3c624ea3f240b25eec40ac63c2678c65.png可以看出虚拟地址ffff99b488d48000对应的物理地址是80000000c8d48000。这个过程也是mmu的过程。

小结

我相信你已经对cpu通过MMU访问内存的本质有所掌握(还是不理解的话不要说认识我),而且通过linux的一个实验,对其软件模拟流程也有所感性的认识。下一篇我们正式进入内存管理的大门——linux内存管理。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

内存保护linux指令,Linux内存管理之MMU的过程 的相关文章

随机推荐

  • IDE Eval Reset 插件安装使用

    IDE Eval Reset 插件 Jetbrains家的产品有一个很良心的地方 他会允许你试用30天 这个数字写死在代码里了 以评估是否你真的需要为它而付费 事实上有一款插件可以实现这个功能 你或许可以用它来重置一下试用时间 但切记不要无
  • 云服务器 文件管理,云服务器文件管理工具

    云服务器文件管理工具 内容精选 换一换 华为云帮助中心 为用户提供产品简介 价格说明 购买指南 用户指南 API参考 最佳实践 常见问题 视频帮助等技术文档 帮助您快速上手使用华为云服务 为安全起见 用户登录弹性云服务器时建议使用密钥对方式
  • vue3 setup语法糖 简单使用

    文档 Vue3 组合式 API 文档 介绍 Vue js vuejs org Vue3 单文件组件
  • MyBatis中foreach使用

    目录 1 foreach中的属性说明 2 collection属性的详细说明 3 示例 1 传入的是单参数且参数类型是一个List 2 传入的是单参数且参数类型是一个array数组 3 传入的参数是实体类 并且实体中包含数组和集合 4 传入
  • 实用工具篇(三):Free Mybatis plugin

    实用工具篇 三 Free Mybatis plugin 实用工具篇 一 Postman 实用工具篇 二 SourceTree Free Mybatis plugin 老规矩先吹一波 这个idea里面的插件真的十分nice 上个图让你们知道他
  • Scrum敏捷开发:适应变化的核心能力

    在当今高度变化的时代 软件开发的环境和要求也在不断变化 传统的开发方法往往难以适应这种快速变化 因此 一种新的软件开发方法 敏捷开发逐渐得到了广泛的关注和应用 本文将介绍敏捷开发的概念 优势 实践经验 敏捷开发工具以及注意事项 帮助您更好地
  • 解决vue-router跳转不起作用

    router 这么写 export default new Router mode history routes path homePage name HomePage component HomePage path topUpPage n
  • C++面向对象之封装

    C 在 C 语言的基础上增加了面向对象编程 C 支持面向对象程序设计 类是 C 的核心特性 通常被称为用户定义的类型 类用于指定对象的形式 它包含了数据表示法和用于处理数据的方法 类中的数据和方法称为类的成员 函数在一个类中被称为类的成员
  • CancelToken——取消请求

    CancelToken 取消请求 应用于第二次请求比第一次请求更快的情况 首先我们要明确 cancelToken是axios用来取消请求的API 那为什么要取消呢 是由于浏览器的请求的响应时间存在不确定性 请求次数过多可能较早发起的请求会比
  • docker - 部署java/python项目

    目录 1 docker 部署 java 项目 1 创建 mysql 容器 2 验证mysql dbserver 连接 mysql 服务器ip 3306 账户 root 密码 123456 3 创建tomcat容器 4 验证 http ip
  • 景联文科技助力医疗AI大模型:数据标注与专业医学资源的重要性

    随着通用人工智能 AI 与生成式人工智能 AIGC 的兴起 人工智能对一些产业的颠覆性影响开始显著加速 我们正在进入一个全新的 属于人工智能的时代 近日 谷歌对外发布谷歌医疗版ChatGPT已在多家诊所内测试 可生成诊断做总结 多个指标和真
  • matplotlib可视化之直方图plt.hist()与密度图

    函数功能 判定数据 或特征 的分布情况 调用方法 plt hist x bins 10 range None normed False weights None cumulative False bottom None histtype b
  • 【JavaScript】怎样判断一个变量是不是数组

    var arr 1 2 3 1 Array isArray console log Array isArray arr 2 instanceOf console log arr instanceof Array 3 constuctor c
  • 谷歌全球大裁员,涉及1.2万人

    Datawhale干货 方向 就业信息 来源 机器之心 最近几天科技领域的流行词不是某一项新技术 而是裁员 1 月 20 日 谷歌母公司 Alphabet 在一份员工备忘录中表示 由于面临 变化的经济现状 该公司将裁员约 1 2 万人 加大
  • unity 烘焙场景的创建、保存和使用(附demo项目)

    这是一个入门教程 demo项目 practice4 unitypackagehttps pan baidu com s 1tnDv3sDUzMlk1YnSmJV29w 密码 1234 1 打开Unity 新建一个场景 2 打开Light窗口
  • 深度linux win7分区,怎么安装Win7深度操作系统?

    安装前准备 一 为Deepin留出硬盘空间以便安装 1 打开磁盘管理 Windows徽标上右键单击 选择磁盘管理 2 选中一个分区 空闲空间大于30G 我选择的是C盘 因为是固态硬盘所以安装启动会快很多 磁盘1的200G分区是我上次安装使用
  • css锚点定位被顶部固定导航栏遮住的解决方案

    标题 css锚点定位被顶部固定导航栏遮住的解决方案 很多网站都有一个固定在上方的导航栏 方便用户搜索和跳转到其他页面 同时为了方便用户浏览长文档 都会加上目录 点击段落标题跳转到段落所在的位置 如图所示 如果使用锚点实现目录的跳转会遇到 f
  • camera理论基础和工作原理

    写在前面的话 本文是因为工作中需要编写摄像头程序 因为之前没有做过这类产品 所以网上搜索的资料 先整理如下 主要参考文章如下 如果有侵权 请联系我 另外 转载请注明出处 本文不一定全部正确 如果发现错误请指正 如果有新的理解 会继续整理 h
  • 西门子1513CPU冗余组态

    西门子1513R冗余配置 1 打开博图16软件 新建项目 添加新设备 在弹出的控制器目录下找到CPU 1513R 1 PN硬件 然后系统自动生成PLC 1和PLC 2 2 打开设备组态中的网络视图 添加接口模块 3 在硬件目录 分布式I O
  • 内存保护linux指令,Linux内存管理之MMU的过程

    之前写过一篇 CPU是如何访问内存的 的文章 简单介绍了cpu访问内存的过程 有了之前的感性认识 这篇站在arm的角度再深度讲解一下 看完你会发现不理解arm原理就直接撸内核代码简直是耍流氓 ARMv8中的访问内存流程 我喜欢用图的方式来说