ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？

2024-04-11

As per pgtable-2-level.h https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/include/asm/pgtable-2level.h、ARM Linux有两个版本的PTE； Linux PTE 和 H/W PTE。 Linux PTE 存储在偏移量 1024 字节以下。

处理页面错误时handle_pte_fault各种功能如pte_file, pte_mkdirty, pte_mkyoung，使用 H/W PTE 版本进行调用。

但实际上 ARM H/W 不支持其 PTE 中的脏位、访问位和文件位。

我的问题是它如何检查 H/W PTE 上页面的脏、已访问、文件位？理想情况下，它应该检查 Linux PTE 上存储在 1024 字节偏移以下的那些位？

我的问题是它如何检查 H/W PTE 上页面的脏、已访问、文件位？

TL;DR - 它们是通过在初始访问时发生页面错误来模拟的。

答案在pgtable-2-level.h https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/include/asm/pgtable-2level.h,

通过仅授予硬件写入权限来模拟“脏”位 iff 该页面在 Linux PTE 中被标记为“可写”和“脏”。这意味着写入干净页面将导致权限错误，并且 Linux MM层将通过handle_pte_fault()将页面标记为脏页。为了使硬件注意到权限更改，TLB 条目必须被刷新，ptep_set_access_flags() 为我们做到了这一点。

采取dirty在这种情况下，页面的初始 MMU 映射被标记为只读。当进程写入时，会生成页面错误。这是handle_pte_fault引用，主要代码在故障.c为do_page_fault https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/mm/fault.c#n236并将调用泛型handle_mm_fault最终结束于handle_pte_fault https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/mm/memory.c#n3780。你可以看到代码，

if (flags & FAULT_FLAG_WRITE) {
        if (!pte_write(entry))
            return do_wp_page(mm, vma, address,
                    pte, pmd, ptl, entry);
        entry = pte_mkdirty(entry);  /** Here is the dirty emulation. **/
}

因此Linux通用代码将检查页面的权限，查看它是否可写并调用pte_mkdirty将页面标记为脏；整个过程是通过故障处理程序启动或模拟的。页面被标记后dirty在Linux PTE中，ARM PTE被标记为可写，因此后续写入不会导致故障。

accessed是相同的，只是读和写最初都会出错。 Afile位也完全未映射，当发生故障时，会查阅 Linux PTE 来查看它是否由文件支持或者是否完全是一个文件。unmapped页面错误。

在用新的权限更新硬件表并完成记账之后，用户模式程序在故障指令处重新启动，除了处理故障的时间间隔之外，它不会注意到差异。

ARM Linux 使用 4k 页，ARM 二级页表大小为 1k（256 个条目 * 4 字节）。来自pgtable-2-level.h评论，

因此，我们稍微调整一下实现 - 我们告诉 Linux 第一层有 2048 个条目，每个条目有 8 个字节（iow，两个指向第二层的硬件指针。）第二层包含两个连续排列的硬件 PTE 表，前面是包含 Linux 所需的状态信息的 Linux 版本。因此，我们最终得到“PTE”级别的 512 条条目。

为了使用完整的 4K 页面，PTE条目的结构如下：

Linux PTE [n]
Linux PTE [n+1]
ARM PTE [n]
ARM PTE [n+1]

四个 1k 项目组成一个完整的 4k 页面。这些页面集合必须按进程进行管理，以便为每个进程提供独特的内存视图，并且共享一些信息以节省实际 RAM。功能cpu_set_pte_ext用于更改物理 ARM 条目。由于每个 ARM CPU 版本使用的表结构和功能略有不同，因此在处理器功能表 https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/include/asm/proc-fns.h#n23它指向一个汇编程序。例如，cpu_v7_set_pte_ext https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/mm/proc-v7-2level.S#n62是 ARMv7 或典型的原始 Cortex CPU 实现。该例程负责检查 Linux 标志并相应地更新硬件位。可以看出，r3被写入pte+2048（从 Linux PTE 到硬件 PTE 的偏移）在此例程结束时。汇编宏armv3_set_pte_ext https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/arch/arm/mm/proc-macros.S#n193 in proc-marcos.S许多较旧的 CPU 变体都使用它。

See: Tim 关于 ARM MM 的笔记 http://elinux.org/Tims_Notes_on_ARM_memory_allocation
适用于 ARM 的 Linux 内核中的页表项 (PTE) 描述符 https://stackoverflow.com/questions/16909101/page-table-entry-pte-descriptor-in-linux-kernel-for-arm

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？的相关文章

在设备驱动程序中使用 select()/poll()

我有一个驱动程序它可以处理多个 TCP 连接有没有一种方法可以在给定列表的情况下执行类似于内核中用户空间应用程序 api 的 select poll epoll 的操作struct sock s Thanks 您可能想编写自己的自定义s
如何识别用户空间和内核空间之间的特定套接字？

我在用户空间中有一个库可以拦截套接字层调用例如socket connect accept 等等我只处理 TCP 套接字在内核空间中我有一个网络内核模块它处理所有 TCP 连接我需要能够在驱动程序中识别哪些套接字被用户空间库拦截
simple_read_from_buffer/simple_write_to_buffer 与 copy_to_user/copy_from_user

我最近编写了一个实现这些功能的模块两者有什么区别据我了解 copy user功能更加安全如果我错了请纠正我此外将这两个功能混合在一个程序中是不是一个坏主意例如我用过simple read from buffer在我的杂项开发
为什么在数据包输入时 skb_buffer 需要跳过 20 个字节才能读取传输缓冲区？

我正在 Linux 中编写一个网络模块我发现只有在从 skb 缓冲区跳过 20 个字节后才能提取 tcp 标头即使 API 是 skb transport header 其背后的原因是什么有人可以详细解释一下吗传出数据包不需要同样的
在 ARM 处理器上执行存储在外部 SPI 闪存中的程序

我有一个 ARM 处理器能够与外部闪存芯片连接写入芯片的是为 ARM 架构编译的程序可供执行我需要知道如何将这些数据从外部闪存获取到 ARM 处理器上以供执行我可以提前运行某种复制例程将数据复制到可执行内存空间吗我想我可以但
如何避免来自mongodb的transparent_hugepage/defrag警告？

我从 mongodb 收到以下关于 THP 的警告 2015 03 06T21 01 15 526 0800 I CONTROL initandlisten WARNING sys kernel mm transparent hugepag
如何通过设备树配置 uio_dmem_genirq 驱动程序

The uio dmem genirq https git kernel org pub scm linux kernel git stable linux stable git tree drivers uio uio dmem geni
使用 gdb 在指定的可执行文件之外单步执行汇编代码会导致错误“无法找到当前函数的边界”

我在 gdb 的目标可执行文件之外甚至没有与该目标对应的堆栈无论如何我想单步执行以便我可以验证汇编代码中发生了什么因为我不是 x86 汇编方面的专家不幸的是 gdb 拒绝进行这种简单的汇编级调试它允许我设置并停止在适当的断点上
Linux 如何在 x86-64 中支持超过 512GB 的虚拟地址范围？

Linux 中 x86 64 的用户虚拟地址空间为 47 位长这本质上意味着 Linux 可以映射大约 128 TB 虚拟地址范围的进程然而令我困惑的是 x86 64 架构支持 ISA 为每个进程定义的 4 级分层页表排列为基数树
Linux 内核模块 Makefile 不能包含相对路径

我正在尝试构建 Linux 内核模块 KBUILD EXTRA SYMBOLS Module symvers KBUILD EXTRA SYMBOLS dir0 Module symvers KDIR kernel linux 4 9 IN
为什么函数 printk() 不使用逗号来分隔参数？

一个例子printk call printk KERN INFO Log message n 也许这个问题更多地是关于C的因为我之前从未见过C中的函数可以不用逗号分隔参数这是如何运作的编译器如何处理这些信息由于日志级别是一个整数而
ARM 中只有两个操作数的 ADD 或 SUB

我正在学习ARM汇编语言我读过 ADD 应该有 3 个操作数然而我见过很多案例现实中只有两种例如 STR R1 SP 0x20 var 1C LDR R1 a lua 0x1DE4E6 MOVS R0 R4 haystack AD
Linux malloc() 在 ARM 和 x86 上的行为是否不同？

这个网站上有很多关于内存分配的问题但是我找不到专门解决我的问题的人这问题 https stackoverflow com questions 19148296 linux memory overcommit details似乎最接近
Linux 内核：为什么调用 kstrtol 会崩溃？

我正在学习内核编程并且对 kstrtol 进行了简单的调用我用它来将字符串转换为数字然而每次我编译这个模块并使用 insmod 将其放入内核时我都会收到 BUG 无法处理 f862b026 处的内核分页请求然后是寄存器和堆栈转储
可以使用Visual Studio 2012构建ARM桌面程序吗？

我正在使用 Visual Studio 2012 beta 我的桌面 win32 程序在 ARM 架构中编译得很好升级到 Visual Studio 2012 RC 后编译器无法工作并出现以下错误不支持为 ARM 平台编译桌面应用程序
如何在Linux内核中启用CONFIG_PREEMPT选项？

我是 Linux 内核编程的新手尝试在 x86 64 上使用旧内核 Linux 2 6 32 我想启用其中的 CONFIG PREEMPT 选项但找不到有关如何执行此操作的信息我可以使用我的首选选项编译新内核但不知道在这种情况下我需
使用 GCC 为 Linux 设备驱动程序编译 Intel AVX 内联

我在 corei7 上的 ubuntu 上运行 gcc 版本 4 8 2 从谷歌搜索中找到了有关 AVX 内在函数的信息但我不确定这组内在函数是否可以用于 Linux 设备驱动程序并进行编译如果可以的话这里的任何人都可以告诉我 mak
USB 端口速度 Linux [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何以编程方式确定运行 Linux 内核的嵌入式设备中的 USB 端口速度你可以阅读 sys bus usb devices usb s
调试严重的 SIGILL 崩溃：文本段损坏

我们的系统是基于 PowerPC 的运行 Linux 的嵌入式系统我们遇到了随机的 SIGILL 崩溃这种情况在各种应用程序中都会出现崩溃的根本原因是将要执行的指令归零这表明内存中的文本段已损坏由于文本段是以只读方式加载的因此应
在执行期间访问.eh_frame数据

我正在尝试访问以下内容 eh frame正在运行的程序的一部分具体来说该程序是 Linux 内核 2 6 34 8 这 eh frame包含用于异常处理的有用数据我想在内核代码内部使用它该部分已经由以下人员编写gcc readelf

随机推荐

获取网格顶点的最佳方法 Three.js

我是 Three js 的新手所以也许我不会以最佳方式解决这个问题我创建的几何图形如下 const geo new THREE PlaneBufferGeometry 10 0 然后我对其进行旋转 geo applyMatrix new
GridSearchCV 在 scikit-learn 中的小数据集上速度极慢

这很奇怪我可以成功运行该示例grid search digits py 但是我无法对自己的数据进行网格搜索我有以下设置 import sklearn from sklearn svm import SVC from sklearn g
使用 MyBatis 动态选择 SQL 语句

我想在 Oracle 12g 数据库中使用 mybatis 进行动态 sql 语句我可以利用哈希映射来添加如下条件
Lighthouse：无法在本地主机上运行生成报告

正如标题所示我正在尝试为本地提供的 nuxt 应用程序生成报告如果我通过 DevTools 生成报告则需要非常长的时间并且给我的评分非常差与在部署的同一站点上生成报告相比如果我尝试使用灯塔扩展生成报告按钮将被禁用我是否会犯
如何制作跨越两列的情节图例

我正在使用绘图来绘制大量数据的比较描述每一行的字符串往往会变长所以我需要将它们设置为多行然而在许多情节中传说可能会消失在屏幕之外我想将图例分成两列有没有办法在情节上做到这一点看着help plotly graph objs
未捕获的异常“DOMException”，消息为“未找到错误”

基本上我正在为我的 CMS 编写一个模板系统我希望有一个模块化结构其中涉及人们放入以下标签
如何以正确的方式将很长的表格布局放入水平滚动视图中？

我尝试查看大量示例和帖子但没有一个符合我的问题我需要制作一个非常长水平的表格其中有很多列因此无法在单个屏幕中显示我不想弄乱桌子因为以这种方式展示我的桌子很重要我在下面粘贴了我的 XML 布局包括主要的重要的问题是如果我
Clojure：在 let 绑定中展开 var

我想在let不同功能的形式比方说 def common assign x 10 y 20 一种方法是用eval eval defn foo let common assign hello world balala 问题是现在你必须引用所有
需要采取的行动：您的应用不符合 Google Play 政策，解决方案是什么？

发现问题数据安全部分无效我们审核了您应用在 Play 管理中心内的数据安全部分发现它与应用收集和共享用户数据的方式之间存在差异所有应用程序都需要完成准确的数据安全部分披露其数据收集和共享实践即使您的应用程序不收集任何用户数据这
RichTextBox 控件中的表格损坏（自动换行）[重复]

这个问题在这里已经有答案了可能的重复为什么 Richtextbox 无法正确显示该表格 https stackoverflow com questions 1928853 why isnt the richtextbox display
在 R 中结合 head 和 tail 方法

我经常使用 R 包 utils 中的 head d 和 tail d 方法经常一个接一个所以我为这两个函数编写了一个简单的包装器 ht lt function d m 5 n m print the head and tail toge
限制从 AWS SQS 触发的 AWS Lambda 的并发调用（忽略保留并发）？

对我来说一开始这似乎是一个简单的用例但结果比我预期的要困难得多 Problem 我有一个 AWS SQS 作为作业队列触发工作线程 AWS Lambda 然而由于工作人员 lambda 共享不可扩展的资源因此将并发运行的 lamb
按列名称对矩阵进行排序

我有以下矩阵 z 0 1 2 3 4 5 8 9 11 12 15 16 17 1 0 9992149 0 0001345895 4 486317e 05 2 243158e 05 6 729475e 05 8 972633e 05 2 2
Android 谷歌地图无法获取连接工厂客户端

我们开始吧去掉问题中的多余部分现在我将添加你想要的任何内容请快点几个问题 1 更改这些行中的包名称
如何自动设置 Watchkit 应用程序目标的版本和内部版本号

Watchkit 应用程序和扩展的版本和内部版本号或版本和短版本必须设置为与包含应用程序相同的值我使用环境变量来设置应用程序版本Info plist在构建时动态地这对于 Watchkit 扩展也适用但不适用于 Watchkit 应
ID3v2.3：ETCO 框架事件格式澄清

根据非正式标准 https web archive org web 20220311010154 https id3 org id3v2 3 0 sec4 6 an ETCO框架是帧头十个字节后面是 a 时间戳格式一个字节接下来是
TF2 对象检测 API：model_main_tf2.py - 验证丢失？

过去两个月我一直在尝试训练一个对象检测模型并最终通过以下方法成功了tutorial https tensorflow object detection api tutorial readthedocs io en latest 这是我的c
某些子网格未使用 CUDA 动态并行执行

我正在尝试 CUDA 5 0 GTK 110 中的新动态并行功能我遇到了一个奇怪的行为即我的程序没有返回某些配置的预期结果不仅是意外的而且每次启动都会出现不同的结果现在我想我找到了问题的根源似乎当生成太多子网格时某些子网格由
为什么 CMake 被设计为在安装时删除运行时路径

我自己构建了我的共享库例如我使用一个计算斐波那契数的库并希望在我的另一个 C 项目中使用它CMake 假设共享库和标头位于 path to my lib 共享库libfib so is in path to my lib lib和标题
ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？

As per pgtable 2 level h https git kernel org cgit linux kernel git torvalds linux git tree arch arm include asm pgtable

ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？

ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？ 的相关文章

随机推荐

热门标签

ARM Linux 如何模拟 PTE 的脏位、访问位和文件位？的相关文章