什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？

2023-11-26

这个问题和我下面的回答主要是针对另一个问题中的一个困惑的地方。

在答案的最后，有一些我并不完全有信心的 WRT“易失性”和线程同步问题 - 我欢迎评论和替代答案。然而，问题的重点主要涉及 CPU 寄存器及其使用方式。

寄存器是 CPU 中的“工作存储器”。它们速度非常快，但资源非常有限。通常，CPU 具有一小组固定的命名寄存器，这些名称是该 CPU 机器代码的汇编语言约定的一部分。例如，32 位 Intel x86 CPU 有四个名为 eax、ebx、ecx 和 edx 的主要数据寄存器，以及许多索引和其他更专用的寄存器。

严格来说，现在情况并不完全正确——例如，寄存器重命名很常见。有些处理器有足够的寄存器，可以对它们进行编号而不是命名等。但是，它仍然是一个很好的基本模型。例如，寄存器重命名用于在乱序执行的情况下保留此基本模型的假象。

在手动编写的汇编程序中使用寄存器往往具有简单的寄存器使用模式。在子例程或其某些重要部分的持续时间内，一些变量将纯粹保留在寄存器中。其他寄存器以读取-修改-写入模式使用。例如...

mov eax, [var1]
add eax, [var2]
mov [var1], eax

IIRC，这是有效的（尽管可能效率低下）x86 汇编代码。在 Motorola 68000 上，我可能会写...

move.l [var1], d0
add.l  [var2], d0
move.l d0, [var1]

这次，源通常是左侧参数，目标在右侧。 68000有8个数据寄存器（d0..d7）和8个地址寄存器（a0..a7），a7 IIRC也用作堆栈指针。

在 6510（回到旧的 Commodore 64）上，我可能会写...

lda    var1
adc    var2
sta    var1

这里的寄存器大多隐含在指令中——上面都使用A（累加器）寄存器。

请原谅这些示例中的任何愚蠢错误 - 至少 15 年以来我没有编写任何大量的“真实”（而不是虚拟）汇编程序。不过，原则才是重点。

寄存器的使用特定于特定的代码片段。寄存器所保存的内容基本上就是其中最后一条指令的内容。程序员有责任跟踪代码中每个点的每个寄存器中的内容。

调用子例程时，调用者或被调用者必须负责确保不存在冲突，这通常意味着寄存器在调用开始时保存到堆栈中，然后在结束时读回。中断也会出现类似的问题。诸如谁负责保存寄存器（调用者或被调用者）之类的事情通常是每个子例程文档的一部分。

编译器通常会比人类程序员以更复杂的方式决定如何使用寄存器，但其运行原理相同。从寄存器到特定变量的映射是动态的，并且根据您正在查看的代码片段而显着变化。保存和恢复寄存器主要是根据标准约定来处理的，尽管编译器在某些情况下可能会即兴发挥“自定义调用约定”。

通常，函数中的局部变量被认为存在于堆栈中。这是 C 中“auto”变量的一般规则。由于“auto”是默认值，因此这些是普通的局部变量。例如...

void myfunc ()
{
  int i;  //  normal (auto) local variable
  //...
  nested_call ();
  //...
}

在上面的代码中，“i”很可能主要保存在寄存器中。随着函数的进行，它甚至可以从一个寄存器移至另一个寄存器，然后再移回。但是，当调用“nested_call”时，该寄存器中的值几乎肯定会在堆栈上 - 要么因为该变量是堆栈变量（而不是寄存器），要么因为保存寄存器内容以允许nested_call拥有自己的工作存储。

在多线程应用程序中，普通局部变量是特定线程的局部变量。每个线程都有自己的堆栈，并且在运行时独占使用 CPU 寄存器。在上下文切换中，这些寄存器被保存。无论是在寄存器中还是在堆栈中，局部变量都不会在线程之间共享。

即使两个或多个线程可能同时处于活动状态，这种基本情况也保留在多核应用程序中。每个核心都有自己的堆栈和寄存器。

存储在共享内存中的数据需要更加小心。这包括全局变量、类和函数中的静态变量以及堆分配的对象。例如...

void myfunc ()
{
  static int i;  //  static variable
  //...
  nested_call ();
  //...
}

在这种情况下，“i”的值在函数调用之间被保留。保留主存储器的静态区域来存储该值（因此称为“静态”）。原则上，在调用“nested_call”期间不需要任何特殊操作来保留“i”，乍一看，可以从任何内核（甚至单独的 CPU）上运行的任何线程访问该变量。

然而，编译器仍在努力优化代码的速度和大小。对主存储器的重复读写比寄存器访问慢得多。编译器几乎肯定会选择not遵循上述简单的读取-修改-写入模式，但会将值保留在寄存器中相对较长的时间，避免重复读取和写入同一内存。

这意味着在一个线程中所做的修改可能在一段时间内不会被另一个线程看到。两个线程最终可能会对上面“i”的值有非常不同的想法。

对此没有神奇的硬件解决方案。例如，没有用于在线程之间同步寄存器的机制。对于CPU来说，变量和寄存器是完全独立的实体——它不知道它们需要同步。不同线程中或在不同内核上运行的寄存器之间当然不存在同步 - 没有理由相信另一个线程在任何特定时间出于相同目的使用相同的寄存器。

部分解决方案是将变量标记为“易失性”......

void myfunc ()
{
  volatile static int i;
  //...
  nested_call ();
  //...
}

这告诉编译器不要优化对变量的读取和写入。处理器没有波动性的概念。该关键字告诉编译器生成不同的代码，按照赋值指定立即读取和写入内存，而不是使用寄存器来避免这些访问。

This is not然而，多线程同步解决方案——至少其本身不是。一种合适的多线程解决方案是使用某种锁来管理对此“共享资源”的访问。例如...

void myfunc ()
{
  static int i;
  //...
  acquire_lock_on_i ();
  //  do stuff with i
  release_lock_on_i ();
  //...
}

这里发生的事情比显而易见的还要多。原则上，可以将“i”的值保存在堆栈上，而不是将“i”的值写回到为“release_lock_on_i”调用做好准备的变量中。就编译器而言，这并非没有道理。无论如何，它都会进行堆栈访问（例如保存返回地址），因此将寄存器保存在堆栈上可能比将其写回“i”更有效 - 比访问完全独立的内存块更适合缓存。

但不幸的是，释放锁函数不知道该变量尚未写回内存，因此无法修复它。毕竟，该函数只是一个库调用（真正的锁释放可能隐藏在更深层的嵌套调用中），并且该库可能在您的应用程序之前几年就已编译 - 它不知道how它的调用者使用寄存器或堆栈。这是我们使用堆栈的一个重要原因，也是为什么调用约定必须标准化（例如，谁保存寄存器）。释放锁函数不能强制调用者“同步”寄存器。

同样，您可以将旧应用程序与新库重新链接 - 调用者不知道“release_lock_on_i”做什么或如何做，它只是一个函数调用。它不知道需要首先将寄存器保存回内存。

为了解决这个问题，我们可以带回“易失性”。

void myfunc ()
{
  volatile static int i;
  //...
  acquire_lock_on_i ();
  //  do stuff with i
  release_lock_on_i ();
  //...
}

当锁处于活动状态时，我们可以暂时使用普通的局部变量，以便编译器有机会在这段短暂的时间内使用寄存器。但原则上，锁应该尽快释放，所以里面不应该有那么多代码。但是，如果我们这样做，我们会在释放锁之前将临时变量写回到“i”，并且“i”的易失性确保它被写回主内存。

原则上，这还不够。写入主内存并不意味着您已经写入了主内存 - 中间有几层缓存需要遍历，并且您的数据可能会在这些层中的任何一层中停留一段时间。这里存在一个“内存屏障”问题，我对此了解不多 - 但幸运的是，这个问题是线程同步调用（例如上面的锁获取和释放调用）的责任。

然而，这个内存障碍问题并没有消除对“易失性”关键字的需要。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？的相关文章

“rep stos”x86 汇编指令序列有什么作用？

我最近偶然发现了以下汇编指令序列 rep stos dword ptr edi For ecx重复存储内容eax到哪里edi指向递增或递减edi 取决于方向标志每次 4 个字节通常这用于memset型操作通常该指令简单地写成r
自动解析 PHP，将 PHP 代码与 HTML 分离

我正在开发一个大型 PHP 代码库我想将 PHP 代码与 HTML 和 JavaScript 分开我需要对 PHP 代码进行多次自动搜索和替换对 HTML 进行不同的搜索和替换对 JS 进行不同的自动搜索和替换有没有一个好的解析器
TypeScript 编译错误 TS5037：除非提供“--module”标志，否则无法编译外部模块

无法编译任何 TS node js 项目包括示例中列出的项目 http typescript codeplex com sourcecontrol latest samples imageboard README txt http typ
使用 NEON 优化 Cortex-A8 颜色转换

我目前正在执行颜色转换例程以便从 YUY2 转换为 NV12 我有一个相当快的函数但没有我预期的那么快主要是由于缓存未命中 void convert hd uint8 t orig uint8 t result uint32 t wi
AVX-512 指令编码 - {er} 含义

在 Intel x86 指令集参考中有许多 AVX 512 指令在指令中具有可选的 er 例如 VADDPD 的一种形式定义为 EVEX NDS 512 66 0F W1 58 r VADDPD zmm1 k1 z zmm2 zmm3 m
在Maven中生成Version.java文件

我有一个使用 Ant 脚本构建的 Java 项目我正在尝试将项目转换为 Maven 其中一项任务生成一个名为 Version java 的 Java 源文件其中包含编译时间戳的静态字符串表示形式如下所示 package com foo
linux x86 汇编语言 sys_read 调用的第一个参数应为 0 (stdin)

我正在编写一个简单的汇编程序来从标准输入读取如 scanf 这是我的代码 section bss num resb 5 section txt global start start mov eax 3 sys read mov ebx 0
X86 预取优化：“计算 goto”线程代码

我有一个相当重要的问题我的计算图有循环和多个计算路径我没有制作一个调度程序循环其中每个顶点将被一一调用而是将所有预先分配的框架对象放置在堆中代码数据这有点类似于线程代码甚至更好 CPS 只是在堆中跳转执行代码每个代
如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
我收到此警告： com.sun.org.apache.xml.internal.serialize.OutputFormat 是 Sun 专有 API，可能会在未来版本中删除

我的代码是 OutputFormat wOf new OutputFormat XML ISO 8859 1 true 帮我解决这个警告提前致谢一种解决方案是不使用该类另一种解决方案是忽略该警告看看这个类我怀疑这是唯一可行的解决
是否可以在Linux上将C转换为asm而不链接libc？

测试平台为Linux 32位但也欢迎 Windows 32 位上的某些解决方案这是一个c代码片段 int a 0 printf d n a 如果我使用 gcc 生成汇编代码 gcc S test c 然后我会得到 movl 0 28 e
如何使用 Bochs 运行汇编代码？

我想使用 Bochs 作为 8086 模拟器是否有捷径可寻我想要的是类似 emu8086 的东西 http www emu8086 com http www emu8086 com 如果程序的初始部分适合 512 字节并且您不介意将自
如何通过命令行将Flash .fla编译为.swf？ [复制]

这个问题在这里已经有答案了如何在基于 Windows 的操作系统上通过命令行将 Flash fla 文件编译为 swf 需要安装的命令行工具就可以了谁能建议我该怎么做以直接的方式谢谢您可以使用JSFL为 Flash IDE 编写脚
如何在Windows上安装机器人操作系统ROSJava？

ROS 的文档很糟糕一个很大的讽刺是 ROS 的 Groovy 和 ROSJava 版本的创建是为了让 Windows 等平台上的开发人员能够利用出色的机器人 SDK 而所有安装说明仍然面向 Linux ubuntu 用户 The ROS
添加冗余赋值可以在未经优化的情况下编译时加快代码速度

我发现一个有趣的现象 include
可以读取目标文件吗？

我很好奇 obj文件我几乎不知道它们是什么或者它们包含什么所以我用 Vim 文本编辑器打开它们我在里面发现了一种类似外星人的语言有什么办法可以理解它们代表什么以及它们的内容是什么另外它们的用途是什么 Thanks Sure 但
NASM 中的 equ 和 db 有什么区别？

len equ 2 len db 2 它们是否相同产生可以用来代替的标签2 如果不是那么每种申报表的优点或缺点是什么它们可以互换使用吗第一个是equate 与 C 类似 define len 2 因为它实际上并没有在最终代码中分配任
整数溢出问题

我不断遇到整数溢出问题我不知道如何解决它有人可以帮忙吗 edx 包含 181 eax 包含 174 xor eax edx mov edx 2 div edx 假设你谈论的是x86 div edx这实际上没有意义 32位div将edx
movzbl(%rdi, %rcx, 1), %ecx 在 x86-64 汇编中意味着什么？

我想我明白 movzbl rdi rcx 1 ecx 意思是将零扩展字节移至长整型并表示将 ecx 扩展为 32 位但我不完全确定语法 rdi rcx 1 指的是什么我在某处看到该语法指的是 Base Index Scale 但我找
英特尔的最后分支记录功能是英特尔处理器独有的吗？

最后分支记录是指存储与最近执行的分支相关的源地址和目标地址的寄存器对 MSR 的集合它们受英特尔酷睿 2 英特尔至强和英特尔凌动处理器系列的支持 http css csail mit edu 6 858 2012 readings ia3

随机推荐

为什么这个 Javascript 方法不会继续调用自身？

我有一个带有特权方法的 JavaScript 对象当此方法完成后我希望它调用自身在短暂的超时后并继续无限期地运行不幸的是该方法只运行两次然后就停止了没有任何错误在 Chrome 和 IE 中测试结果相同代码如下 fun
HTML5 视频源作为本地存储的 blob 不再工作

从 Chrome 80 开始 Blob 或 IndexedDB 的工作方式似乎发生了变化将视频文件作为 blob 加载并通过 createObjectURL 将其分配给 HTML5 Video 元素仍然有效 load the blob t
如何在 SWT 标签中添加文本和图像

有没有办法在 SWT 标签中在一行中添加文本和图像一旦我添加图像文本就会消失不你不能在一个文件中同时拥有图像和文本Label 除非你自定义绘制它其他用途org eclipse swt custom CLabel Code impo
如何用动画改变NumberPicker的值？

我创建了一个 Android 应用程序其中有一个 NumberPicker 我需要更改此 NumberPicker 的值但要具有平滑的动画就像您触摸它并更改其值时一样例如假设当前值为 1 它将是 5 我希望 NumberPicke
设置 stty 参数

我尝试使用 bash 从 ttyS0 读取数据需要设置以下内容但我很难弄清楚 databits 7 stopbits 2 parity 0 flow control 0 这是我的代码 bin bash Port setting stty
即使使用最新的驱动程序，Python pyopencl DLL 加载也会失败

我已经为我的 GPU 安装了最新的 CUDA 和驱动程序我在 Win7 64 位上使用 Python 2 7 10 我尝试从以下位置安装 pyopencl a 非官方 Windows 二进制文件位于http www lfd uci edu
获取 Item 的深度

我有这样的xml a b test b b b test2 b b b b b test2 b b b a 如何使用 linq to xml 获取每个项目的级别测试级别 1 测试级别 2 测试级别3 3 我不知道会有多少个节点或有多少个级
Django：禁止直接分配到多对多集的前侧。使用 user.set() 代替

当我尝试将当前登录的用户添加到另一个关系中时出现此错误ManyToManyField TypeError Direct assignment to the forward side of a many to many set is pro
jquery 在焦点或单击时触发操作，但不能同时触发两者

我有这个示例代码 myTrigger click function e alert click focus function e alert focus this click 目的是我希望当您单击 myTrigger 时发生一些事情另一方
如何查看 Typescript 类型的完整扩展合约？

如果我有一个看起来有点像这样的类型集合 type ValidValues string number null type ValidTypes text time unknown type Decorated name string nul
如何在 MAUI 项目中包含每个平台的现有 C++ 库？

我们有一个针对每个平台构建的 C 库即适用于 Windows 的 dll 适用于 Android 的 so 和适用于 iOS 的 a 尝试以下方法将 so 文件包含在 Android 版 MAUI 应用程序中其他平台待定 Platfor
是否可以通过 scikit-learn 中自定义内核的网格搜索来调整参数？

我有一个自定义内核函数并且我将 GridSearchCV 函数与 SVC kernel my kernel 一起使用 my kernel 函数需要一个参数 k 来调整所以我想知道是否可以配置 param grid 选项来调整我的自定义内
ESLint 可以帮助您防止未处理的承诺拒绝吗？

eslint 是否有能力警告地方以防止未处理的承诺拒绝未处理的承诺拒绝已被弃用未来许诺未处理的拒绝将终止 Node js 进程具有非零退出代码 DEP0018 你知道吗我有点喜欢引擎当前处理 Unhandled Promise
如何使用AccessibilityService.getWindows()获取可遍历的AccessibilityNodeInfo？

我正在写一个AccessibilityService对于 Android 直到 API 级别 20 我一直在使用AccessibilityEvent getSource 获取可遍历的方法AccessibilityNodeInfo when
在 Android 中获取当前星期几的最简单方法是什么？

在 Android 中获取当前星期几最简单的方法是什么爪哇Calendar类作品 Calendar calendar Calendar getInstance int day calendar get Calendar DAY OF WE
如何使用ajax函数发送表单而不刷新页面，我错过了什么？我必须使用rest-framework吗？

我正在尝试使用 ajax 发送评论表单现在当用户插入评论时整个页面都会刷新我希望能够很好地插入此内容而无需刷新页面所以我尝试了很多东西但没有运气由于我是初学者我尝试遵循许多教程链接 https realpython com b
创建 Java 消息对话框（swing/awt/其他）的最快方法？

我正在创建一个 Java 应用程序它将执行一些处理然后需要显示一条消息以向用户提供反馈然而它似乎非常慢需要两秒钟多的时间才能返回我将源代码剥离到明显的罪魁祸首这里是使用的代码 package SwingPlay import
如何以编程方式生成 Android 按键

在我的应用程序中当用户按下 DPAD LEFT 时我想生成两次 DPAD UP 按下我知道可以使用这样的方法来完成 Override private boolean onKeyDown int keyCode KeyEvent eve
“kotlin-android-extensions”Gradle 插件已弃用

对于 Gradle 版本 6 2 和 Android studio 版本 4 0 1 我有以下弃用消息Kotlin android extention 任何人都知道如何解决它它已被弃用谷歌文档 Kotlin Android 扩展已被弃用
什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？

这个问题和我下面的回答主要是针对另一个问题中的一个困惑的地方在答案的最后有一些我并不完全有信心的 WRT 易失性和线程同步问题我欢迎评论和替代答案然而问题的重点主要涉及 CPU 寄存器及其使用方式寄存器是 CPU 中的工作存

什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？

什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？ 的相关文章

随机推荐

热门标签

什么是 CPU 寄存器以及它们如何使用，特别是 WRT 多线程？的相关文章