组装为什么lea快？

2023-12-15

我和我的教授交谈过，他说：

leaq (%rax,%rax,8)

比以下速度更快：

imulq $9, %rax

我问他为什么（在这两种情况下，我们都用几乎相同的数字进行乘法），他说我们不会讨论这个。

有人可以帮助我简单地理解为什么 leaq 总体上很快吗？

评论中提出的一个问题是：

imulq $9, %rax

比执行 2 个命令更快，一个命令左移，另一个命令添加 %rax（我们之前可以将其保存在寄存器中）

and why?

The lea（加载有效地址）是执行指针算术常用操作的一种方法。指令如何引用其操作数称为其寻址方式 and lea支持scaled or 基址加索引加偏移量寻址模式（等等）。

address = base address + index * scaling + offset

其中缩放值可以是几个 2 的幂 (1, 2, 4, 8) 之一。这些值对于字节、字符、整数、指针等数组很有用。它不能对任意值进行编码或执行乘法。在硬件中，这几个选项可以通过几个多路复用器来实现，延迟只有一个周期的一小部分。

另一方面，乘法指令通过可以将两个任意全角（64 位）操作数相乘的乘法电路。这是一个复杂度明显更高的操作。即使并行使用多个全角加法器，其延迟也约为全角加法器的六倍 (log n)（尽管设计可能会采用优化，使其能够更快地乘以更简单的值）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

组装为什么lea快？的相关文章

编写 AMD64 SysV 程序集时使用哪些寄存器作为临时寄存器？

我正在使用实现一个功能cpuid根据 AMD64 SysV ABI 进行组装我需要在函数本身中使用 2 个临时寄存器第一个用于累积返回值第二个用作计数器我的功能目前如下所示 zero argument function some c
为什么我可以使用 ret 退出 main？

我即将弄清楚程序堆栈到底是如何设置的我了解到用以下方式调用该函数 call pointer 实际上等同于 mov register pc programcounter add register 1 where 1 is one instr
一条指令可以同时处于两种寻址模式吗？

我在书中读到了以下内容从头开始编程处理器有多种不同的访问数据的方式称为寻址模式最简单的模式是立即模式其中要访问的数据嵌入在指令本身中例如如果我们想将寄存器初始化为 0 而不是给出计算机要从中读取 0 的地址我们将指定立即
CPU缓存：两个地址之间的距离是否需要小于8字节才能具有缓存优势？

这似乎是一个奇怪的问题假设缓存行的大小为 64 字节此外假设 L1 L2 L3 具有相同的缓存行大小 this https stackoverflow com a 15333156 8385554帖子说英特尔酷睿 i7 就是这种情况
为什么不能执行 mov [eax], [ebx] [重复]

这个问题在这里已经有答案了我可以做这个 mov eax ebx 和这个 mov eax ebx 甚至这个 mov eax ebx 但不是这个错误C2415 mov eax ebx 只是wtf 为什么它与 ptr1 ptr2 相同为什
为什么 Solaris 汇编器生成的机器代码与 GNU 汇编器在这里不同？

我为 amd64 编写了这个小汇编文件对于这个问题来说代码的作用并不重要 globl fib fib mov edi ecx xor eax eax jrcxz 1f lea 1 rax ebx 0 add rbx rax xchg r
为什么 Visual Studio 使用 xchg ax,ax

我正在查看程序的反汇编因为它崩溃了并注意到很多 xchg ax ax 我用谷歌搜索了一下发现它本质上是一个 nop 但是为什么 Visual Studio 会执行 xchg 而不是 noop 该应用程序是一个C NET3 5 64位应
在linux x86平台上学习ARM所需的工具[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 x86 linux 机器在阅读一些关于 ARM 的各种信息时我很好奇现在我想花一些时间学
近调用/跳转表并不总是在引导加载程序中工作

一般问题我一直在开发一个简单的引导加载程序并在某些环境中偶然发现了一个问题在这些环境中此类指令不起作用 mov si call tbl SI Call table pointer call call tbl Call print c
为什么 RISC-V S-B 和 U-J 指令类型以这种方式编码？

我正在读一本书计算机组织与设计RISC V版我遇到了 S B 和 U J 指令类型的编码我上面提到的那些类型有奇怪的编码立即字段 S B 类型将直接字段分为两部分这是有道理的因为所有指令编码都必须相似但我无法理解为什么立即字段以
为什么x86分页没有特权环的概念？

早在 1982 年当 Intel 发布 80286 时他们在分段方案中添加了 4 个特权级别环 0 3 由全局描述符表 GDT 和局部描述符表 LDT 中的 2 位指定在 80386 处理器中 Intel 添加了分页功能但令人惊讶
在 x86-64 CPU 上通过交叉修改代码重现意外行为

Question 对于可能在 x86 或 x86 x64 系统上触发意外行为的交叉修改代码有哪些想法在这些系统中交叉修改代码中的所有操作均已正确完成但在执行处理器之前执行序列化指令除外修改代码如下所述我有一个 Core 2 Duo
汇编8086监听键盘中断

我有与此完全相同的问题边画边听键盘 https stackoverflow com questions 13970325 8086 listen to keyboard while drawing 但第一个答案接受的答案只听键盘一次
Verilog 双向握手示例

我正在完成一个项目要求是处理器内部功能单元之间的双向握手我知道它是什么但是有没有任何标准或一个简单的例子我唯一能想到的就是两个单元之间当它们之间有一条数据线并且当 X 发送到 Y 时会给出一个单独的发送信号当 Y 接收
为什么 GCC 不将 a*a*a*a*a*a 优化为 (a*a*a)*(a*a*a)？

我正在对科学应用程序进行一些数值优化我注意到的一件事是 GCC 会优化调用pow a 2 通过将其编译成a a 但是调用pow a 6 没有优化实际会调用库函数pow 这大大降低了性能相比之下英特尔 C 编译器 http en wi
在 x86 ASM 中测试零通常哪个更快：“TEST EAX, EAX”与“TEST AL, AL”？

测试 AL 中的字节是否为零非零通常哪个更快 TEST EAX EAX TEST AL AL 假设之前有一个 MOVZX EAX BYTE PTR ESP 4 指令加载了一个带有零扩展的字节参数到 EAX 的其余部分防止了我已经知道的组
为什么在强度降低乘法和循环进位加法之后，这段代码的执行速度会变慢？

我正在读书阿格纳雾 https en wikipedia org wiki Agner Fog s 优化手册 https en wikipedia org wiki Agner Fog Optimization 我遇到了这个例子 doub
有没有办法使用 i387 fsqrt 指令获得正确的舍入？

有没有办法使用 i387 fsqrt 指令获得正确的舍入除了改变精确模式在 x87 控制字中我知道这是可能的但这不是一个合理的解决方案因为它存在令人讨厌的重入型问题如果 sqrt 操作中断精度模式将出错我正在处理的问题如下 x
AVX-512CD（冲突检测）与原子变量访问有何不同？

所以我在看他们展示了如何 void Histogram const float age int const hist const int n const float group width const int m const float o
如何在 Debian 上编译 DOS 程序？

在我的汇编语言课程中我们使用 DPMI 编写 DOS 程序不幸的是我无法一直使用 32 位 Windows 机器我在我使用的几乎每台计算机上都安装了 Debian 虚拟机我已经安装了 DOSBox 和 DOSEMU 有什么办法可以

随机推荐

在 64 位 Windows 10 上安装 OpenSSL for MSVC2017

pro LIBS LC Qt Tools OpenSSL Win x86 lib llibssl LIBS LC Qt Tools OpenSSL Win x86 lib llibcrypto INCLUDEPATH C Qt Tools
在 Windows 上使用 php 和 pear 发送邮件

我正在尝试使用 php 脚本发送电子邮件但收到错误这是我的代码我正在使用 xampp netbeans 和 windows 我在 php ini 文件中包含了 pear 但仍然有错误任何想法 require once Mail php
rapply 到 R 中的嵌套列表

我无法对嵌套列表进行说唱以下是列表中一个元素的示例结构 F01 List of 7 0 data frame 16 obs of 3 variables lengths Factor w 8 levels 1 2 4 5 1 2 3 4
生成_id即可。 MongoDB 中的 ObjectId 自动生成

我正在开发一个创建永久链接的应用程序我不知道如何将文档保存在 MondoDB 中两种策略 ObjectId 自动生成 MongoDB 自动生成 id 我需要创建一个索引permalink字段因为我通过永久链接获取信息我还可以使用以下
如何知道一个标签是否包含一个值或另一个标签？

我在 java 中使用 DOM 表示如何区分 xml 标签内部是否有值或是否有另一个嵌入标签例如我可以有
(char *) x 或 (void *) z 是什么意思？

I know char x意味着指向 char 的指针但我对什么感到困惑 char x means 这是一个演员阵容您正在指示编译器处理x就好像它是一个char 无论其真实类型如何仅当您真正知道自己在做什么时才应使用强制转换对于某些
CSS3 多重变换

我有一个 css3 动画我使用下面的代码在 X 轴上旋转立方体 webkit keyframes spin2 from webkit transform rotateX 135deg to webkit transform rotateX
安装因错误而失败 (Eclipse)

当我尝试安装安装完成时出现错误安装失败并出现错误显示日志即使我以管理员身份运行它也会发生这种情况我使用的是 Windows 7 Professional 64 位当我单击显示日志时这就是我的情况看 2017 04 03 20 3
Apache-Ignite 集成作为 Hibernate 二级缓存未启动？

我正在尝试将 Apache Ignite 设置为我的项目中的第二级 Hibernate 缓存提供程序但我遇到了一个奇怪的异常配置如下 POM xml Added
ggplot 中其他点的图例

举这个问题的例子 Link 我想问是否可以在图例中添加额外的蓝点 dat lt data frame cond rep c A B each 10 xvar 1 20 rnorm 20 sd 3 yvar 1 20 rnorm 20 sd
如何将变量从 php 发送到 Android 应用程序？

大家好我当前的 Android 应用程序中有一个活动其中有一个网络视图我想知道如何从该网站上的 php 获取变量并将其存储到我的 android 应用程序上的变量中是的我控制该网站并且具有完整的编辑功能我会解释一般需要做的事情
在 OSX 上隐藏 Tkinter 应用程序的控制台

当我启动基于 GUI Tkinter 的应用程序时我试图隐藏终端但是当我双击 OSX 上的 app py 文件时会出现终端窗口我尝试将扩展名更改为 pyw 并尝试使用 usr bin pythonw 启动它但无论如何终端窗口仍然
无法快速移动键盘视图iOS9

我需要实现一个拒绝键盘向下滑动以拒绝就像 iOS 上的股票消息应用程序中的键盘一样我有这段代码来获取键盘视图 func keyboardWillShowWithNotification notification NSNotificat
为什么 JQuery ajax 调用后页面会重新加载？

我的目录如下根目录 Create php根资源 js ajaxLibrary js 在我的 create php 文件中我有一个如下所示的表单
使用位图的列表视图

我一直在尝试创建列表视图的位图其中整个列表视图在屏幕上不可见我在用 Bitmap mBitmap fullView getDrawingCache 创建位图它适用于屏幕上可见的列表视图部分但不适用于不可见的部分我想知道是否可以创建
我可以使用 localhost 在 SDK 中测试 XMLHttpRequest() 吗？

以下代码似乎不起作用因为当我尝试在 Google App Engine Python 中获取选择器时它是未定义的 chooser self request get chooser self response out write ch
即使应用程序未运行，也处理 onMessageReceived() 和 onTokenRefresh()

我有一个包含 2 项服务的应用程序 MessagingService extends FirebaseMessagingService and InstanceIDService extends FirebaseInstanceIdServ
单元格上的 VBA 通配符搜索

我正在尝试在单元格值中使用通配符搜索来查找某些内容如果sheet FC Range I2 I LastRowC 中的值与Sheets Instr Range A130 A190 匹配表示如果少数字符与上述其他范围匹配则表 Instr
NHibernate 配置连接到 Visual FoxPro 8.0？

好奇是否有人曾经将 NHibernate 连接到 Visual Foxpro 8 0 我希望连接到遗留数据存储并且更愿意使用 NHibernate 而不是必须手动编码所有 ADO Net 如果有人有 FoxPro 8 连接的配置 XML
组装为什么lea快？

我和我的教授交谈过他说 leaq rax rax 8 比以下速度更快 imulq 9 rax 我问他为什么在这两种情况下我们都用几乎相同的数字进行乘法他说我们不会讨论这个有人可以帮助我简单地理解为什么 leaq 总体上很快吗评论

组装为什么lea快？

组装为什么lea快？ 的相关文章

随机推荐

热门标签

组装为什么lea快？的相关文章