为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？

2023-11-22

我有一个关于装配的基本问题。

如果算术运算也可以在内存上运行，为什么我们还要费心只在寄存器上进行算术运算呢？

例如，以下两个原因（本质上）导致计算出相同的值作为答案：

片段1

.data
    var dd 00000400h

.code

    Start:
        add var,0000000Bh
        mov eax,var
        ;breakpoint: var = 00000B04
    End Start

片段2

.code

    Start:
        mov eax,00000400h
        add eax,0000000bh
        ;breakpoint: eax = 0000040B
    End Start

据我所知，大多数文本和教程主要在寄存器上进行算术运算。使用寄存器是不是更快？

如果您查看计算机体系结构，您会发现一系列内存级别。靠近 CPU 的设备速度快、成本高（每比特），因此体积小，而另一端则有大、慢且便宜的内存设备。在现代计算机中，这些通常类似于：

 CPU registers (slightly complicated, but in the order of 1KB per a core - there
                are different types of registers. You might have 16 64 bit
                general purpose registers plus a bunch of registers for special
                purposes)
 L1 cache (64KB per core)
 L2 cache (256KB per core)
 L3 cache (8MB)
 Main memory (8GB)
 HDD (1TB)
 The internet (big)

随着时间的推移，越来越多的缓存级别被添加——我记得曾经有段时间，CPU 没有任何板载缓存，而我还没有老！如今，HDD 配备了板载缓存，并且互联网可以在任意位置进行缓存：内存中、HDD 上，也可能在缓存代理服务器上。

急剧下降（通常是数量级）带宽并增加latency在远离CPU的每一步中。例如，HDD 可能能够以 100MB/s 的速度读取，延迟为 5ms（这些数字可能并不完全正确），而主内存可以以 6.4GB/s 的速度读取，延迟为 9ns（六阶）震级！）。延迟是一个非常重要的因素，因为您不想让 CPU 等待的时间超过其必须的时间（对于具有深层管道的架构尤其如此，但这是另一天的讨论）。

这个想法是，您经常会一遍又一遍地重复使用相同的数据，因此将其放入小型快速缓存中以供后续操作是有意义的。这被称为时间局部性。局部性的另一个重要原则是空间局部性，这表示彼此靠近的内存位置可能会在大约同一时间被读取。正是由于这个原因，从 RAM 读取将导致读取更大的 RAM 块并将其放入 CPU 缓存中。如果没有这些局部性原则，那么内存中的任何位置在任何时候都有相同的机会被读取，因此无法预测接下来将访问什么，以及所有级别的缓存世界上的速度不会提高。您不妨只使用硬盘驱动器，但我确信您知道计算机在分页时突然停止的感觉（这基本上是使用 HDD 作为 RAM 的扩展）。从概念上讲，除了硬盘之外没有内存是可能的（许多小型设备只有一个内存），但这与我们熟悉的相比会慢得令人痛苦。

拥有寄存器（并且只有少量寄存器）的另一个优点是它可以让您拥有较短的指令。如果您的指令包含两个（或更多）64 位地址，那么您将拥有一些长指令！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？的相关文章

Android 性能：SharedPreferences 的成本

当我的应用程序启动时我使用分片首选项中的值填充容器类这个想法是处理 SharedPreferences 和 PreferenceManager 一次因为我猜它们很重这是一个示例 SharedPreferences prefs Pre
在 x86 程序集中存储大量布尔值的最佳方法是什么？

最近我一直在处理充满布尔值的大型数组目前我将它们存储在 bss部分有一个 space指令它允许我创建字节数组但是由于我只需要存储布尔值因此我希望从数组中逐位读取和写入数据目前我能想到的最好方法是有一个 space指令所需存储
是否可以在Linux上将C转换为asm而不链接libc？

测试平台为Linux 32位但也欢迎 Windows 32 位上的某些解决方案这是一个c代码片段 int a 0 printf d n a 如果我使用 gcc 生成汇编代码 gcc S test c 然后我会得到 movl 0 28 e
当我使用可变参数而不是常量参数时，为什么我的内联表 UDF 慢得多？

我有一个表值内联 UDF 我想过滤该 UDF 的结果以获得一个特定值当我使用常量参数指定过滤器时一切都很好并且性能几乎是瞬时的当我使用可变参数指定过滤器时它会花费明显更大的时间块大约是逻辑读取的 500 倍和持续时间的 20 倍
Haskell：IORef 的性能

我一直在尝试在 Haskell 中编码一个需要使用大量可变引用的算法但与纯粹的惰性代码相比它也许并不奇怪非常慢考虑一个非常简单的例子 module Main where import Data IORef import Contr
Pandas hub_table 更快的替代品

我正在使用熊猫pivot table在大型数据集 1000 万行 6 列上运行由于执行时间至关重要因此我尝试加快流程目前处理整个数据集大约需要 8 秒这太慢了我希望找到替代方案来提高速度性能我当前的 Pandas 数据透视
高效memcspn

有谁知道 memcspn 函数的有效实现吗它的行为应该类似于 strcspn 但在内存缓冲区中查找跨度而不是在以 null 结尾的字符串中查找跨度目标编译器是 VisualC 谢谢卢卡一种近乎最佳的实现 size t memcsp
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
哪些属性有助于运行时 .Net 性能？

我正在寻找可用于通过向加载器 JIT 编译器或 ngen 提供提示来确保 Net 应用程序获得最佳运行时性能的属性例如我们有可调试属性 http msdn microsoft com en us library k2wxda47 aspx
为什么n++执行速度比n=n+1快？

在C语言中为什么n 执行速度快于n n 1 int n n int n n n 1 我们的老师在今天的课堂上问了这个问题这不是家庭作业如果您正在开发一个石器时代编译器的情况下石器时代 n比n 比n n 1 机器通常有incre
为什么在展开的 ADD 循环内重新初始化寄存器会使其运行速度更快，即使循环内有更多指令？

我有以下代码 include
我可以让这个 Ruby 代码更快并且/或使用更少的内存吗？

我有一个Array of StringRuby 中的对象由如下单词组成 animals cat horse dog cat dog bird dog sheep chicken cow 我想将其转换为另一个Array of String对象
SIMD 和 VLIW 指令是一样的吗？

SIMD 单指令多数据和 VLIW 超长指令字到底有什么区别其中一个是另一个的子集吗或者它们是两个完全不同的东西完全不相关且正交一台机器可以有一个或两个或者两者都没有 SIMD 指令可以作为扩展添加到 VLIW ISA 但 V
为什么X86中没有NAND、NOR和XNOR指令？

它们是您可以在计算机上执行的最简单的指令之一它们是我亲自实施的第一个指令执行 NOT AND x y 会使执行时间和依赖链长度和代码大小加倍 BMI1 引入了 andnot 这是一个有意义的补充是一个独特的操作为什么不是这个问题
Swift 使用哪种通用排序算法？它在排序数据上表现不佳

我一直在挑选和探索 Swift 标准库sort 其函数为Array类型令我惊讶的是我注意到它在已经排序的数据上表现不佳对数组进行排序Int打乱顺序似乎比对已经排序的同一个数组进行排序快 5 倍对已打乱顺序的对象数组进行排序比对已按排
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
无法识别的仿真模式：MinGW32 上的 elf_i386

我正在尝试制作内核但无法链接C与程序集一起输出这ld 我收到错误无法识别的仿真模式 elf i386 我正在使用 Windows 10 专业版以及 MinGW32 和 MSYS 我正在使用的代码 link ld link ld OUT
TypeScript 编译速度极慢 > 12 秒

只是把它放在那里看看其他人是否也遇到这个问题我已经使用 webpack 作为我的构建工具使用 typescript 构建了一个 Angular 2 应用程序一切都运行良好但是我注意到 typescript 编译超级超级慢我现在只有
C++ Exp 与 Log：哪个更快？

我有一个 C 应用程序需要比较两个值并决定哪个值更大唯一的复杂之处是一个数字在对数空间中表示而另一个则不是例如 double log num 1 log 1 23 double num 2 1 24 如果我想比较num 1 and
R 数据结构的运算效率

我想知道是否有任何关于操作效率的文档R 特别是那些与数据操作相关的例如我认为向数据框添加列是有效的因为我猜您只是向链接列表添加一个元素我想添加行会更慢因为向量保存在数组中C level你必须分配一个新的长度数组n 1并将所有元素复

随机推荐

Android - 对话框中的共享元素转换

我想知道是否有任何方法可以在活动片段和对话框之间使用共享元素我有一个包含对话框的项目我想在 Activity 视图层次结构中的 ImageView 到 GalleryDialog 中的相关 ImageView 之间进行转换我搜索了一
具有核心列表内容的动画页面的聚合物核心过渡

继从这个问题我进一步发展了演示消息示例尝试使用核心列表在两个页面之间创建页面转换我正在努力实现以下目标每个页面上的 fab 上的英雄过渡两个页面上的幻灯片过渡方向相反无论您在列表中滚动到何处这都会按预期工作请注意单击 fab
在 tel:// 链接中插入暂停

我正在创建一个供 iOS 用户使用的 Web 应用程序但数据库中的某些电话号码需要添加扩展名有什么办法可以修改tel URL 方案是否包含暂停或等待提前致谢您可以使用 p 暂停例如电话 12345678 123 将更改为 p
SaveFileDialog 上的 DialogResult.OK 不起作用

我尝试当我按下保存时SaveFileDialog我做某事我尝试修复但总是出错 SaveFileDialog dlg2 new SaveFileDialog dlg2 Filter xml xml dlg2 DefaultExt xm
Oracle C# 中的参数化查询

string sqlCmd SELECT r row id AS resp id r name AS resp name FROM srb s resp r srb s per resp pr srb s contact c srb s u
在没有 Maven 或 ANT 的情况下以编程方式将 WsImport 与 JAXB 插件结合使用？

我在用WsImport从远程 WSDL 文件生成一些 Java 源代码请注意这是来自常规 Scala 项目内部即它不是在 Maven 或 Ant 构建中完成的 import com sun tools ws WsImport def
同时应用渐变背景颜色和图像

是否可以同时将背景图像和背景颜色应用于文本字段我想要实现的是在文本字段的右上角显示一个图标还使用样式使该文本字段有点渐变 background moz linear gradient center bottom white D6E5F
如何将“子行”插入 Wicket 数据表

我有一个AjaxFallbackDefaultDataTable每个测试结果包含一行测试结果可能会附有注释需要在测试结果下方显着位置显示希望给出类似于以下的表格 Test Result Appraisal 1 20 0 PASS 2
R Shiny - 如何在更新依赖反应图之前更新依赖反应 selectInput

应用程序结构我有一个闪亮的应用程序具有典型的侧边栏面板主面板结构侧边栏面板侧边栏面板中有多个 selectInput 小部件其中每个 selectInput 中的选择取决于前一个 selectInput 的选择值即用户从
Sequelize：错误：错误：表1未与表2关联

我正在尝试使用sequelize 创建以下关联但我不断收到以下错误错误错误客户未与订单关联根据我在文档中发现的内容我有双向关联我对问题可能是什么感到困惑因为当我查看数据库表时我可以看到外键对于此示例我尝试提取与特定订单
Jenkins 无法启动硒测试（等待创建配置文件超时）

Jenkins 无法启动 Selenium 测试 ubuntu 错误 11 26 24 652 信息启动 org openqa jetty jetty Server ab50cd 11 26 24 738 信息正在准备 Firefox
Google 趋势配额限制

我试图从 Google 趋势中提取数据仅尝试了 2 次就收到您已达到每日限制错误有什么办法可以解决这个问题吗我知道 Google API 项目有特殊的配额限制但 Google Trends 没有 API 我还读到我们可能需要向它
查找 >2 个文件中的共同元素

我有三个文件如下所示文件1 txt aba 0 0 aba 0 0 1 abc 0 1 abd 1 1 xxx 0 0 文件2 txt xyz 0 0 aba 0 0 0 0 aba 0 0 0 1 xxx 0 0 abc 1 1 文件
Composer install -n --ignore-platform-reqs 不忽略 PHP 扩展

我们有运行的循环构建composer install n ignore platform reqs no dev但这不再忽视平台要求这是我在圈子日志中看到的这 ignore platform reqs显然不起作用有什么想法吗 Your
Jersey：“找不到语法元素”是什么意思？

将 Jersey 从版本 1 15 升级到 1 17 后它开始记录以下消息 Apr 2 2013 5 13 06 PM com sun jersey server wadl generators AbstractWadlGenerator
Django Rest Framework 请求对AllowAny 设置进行身份验证

我创建了一个JWT 授权应用程序的后端登录注销令牌检索和刷新都工作正常符合预期今天早上我添加了一个注册视图它抛出了通常的情况 detail Authentication credentials were not provided
在Java中获取当前年份的整数值

我需要将 Java 中的当前年份确定为整数我可以用java util Date 但它已被弃用对于 Java 8 及以上版本 int year Year now getValue 对于旧版本的 Java int year Calendar
如何获取从 ButtonGroup 中选择哪个 JRadioButton

我有一个 Swing 应用程序其中包含表单上的单选按钮我有ButtonGroup 但是查看可用的方法我似乎无法获取所选的名称JRadioButton 到目前为止我可以说的是从 ButtonGroup 中我可以执行getSele
android：字符串格式指定粗体

我有一个字符串定义在string xml like
为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？

我有一个关于装配的基本问题如果算术运算也可以在内存上运行为什么我们还要费心只在寄存器上进行算术运算呢例如以下两个原因本质上导致计算出相同的值作为答案片段1 data var dd 00000400h code Start ad

为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？

为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？ 的相关文章

随机推荐

热门标签

为什么我们要在汇编中使用 CPU 寄存器，而不是直接使用内存呢？的相关文章