什么是微编码指令？

2024-04-23

我看过很多参考微编码指令的文献。

这些是什么以及为什么使用它们？

CPU 读取机器代码并将其解码为内部控制信号，将正确的数据发送到正确的执行单元。

大多数指令映射到一个内部操作，并且可以直接解码。（例如，在 x86 上，add eax, edx只是将 eax 和 edx 发送到整数 ALU 进行 ADD 操作，并将结果放入 eax 中。）

其他一些单一指令可以much更多的工作。例如x86 的rep movs http://www.felixcloutier.com/x86/REP:REPE:REPZ:REPNE:REPNZ.html实施memcpy(edi, esi, ecx)，并且需要CPU循环。

当指令解码器看到这样的指令时，它们不是直接产生内部控制信号，而是从微代码 ROM 中读取微代码。

微编码指令是一种解码为许多内部操作的指令

现代 x86 CPU 始终将 x86 指令解码为内部微操作。在这个术语中，即使在add [mem], eax解码为来自的负载[mem]，ALU ADD 操作，以及存储回[mem]。另一个例子是xchg eax, edx, which 在 Intel Haswell 上解码至 3 uop https://stackoverflow.com/questions/45766444/why-is-xchg-reg-reg-a-3-micro-op-instruction-on-modern-intel-architectures。有趣的是，这与使用 3 个 MOV 指令与暂存寄存器进行交换所获得的微指令并不完全相同，因为它们不是零延迟的。

在 Intel / AMD CPU 上，“微编码”意味着解码器打开微代码定序器将 ROM 中的微指令送入管道，而不是直接产生多个微指令。

(如果您以纯 RISC 术语进行思考，则可以将任何多微指令 x86 指令称为“微编码”，但在 IMO 中，使用术语“微编码”来进行不同的区分很有用。我认为这个含义在 x86 优化圈中很普遍，就像 Intel 的优化手册一样。其他人可能会使用不同的术语含义，尤其是在将 x86 与 RISC 进行比较时谈论其他体系结构或一般计算机体系结构时。）

在当前的 Intel CPU 中，解码器在不进入微代码 ROM 的情况下可以直接生成的内容的限制是 4 uops（融合域）。 AMD 类似地具有 FastPath（又名 DirectPath）单指令或双指令（1 或 2 个“宏操作”，AMD 相当于 uops），除此之外，它是 VectorPath 又名微代码，如所解释的David Kanter 对 AMD Bulldozer 的深入了解 http://www.realworldtech.com/bulldozer/5/，具体说说它的解码器。

另一个例子是 x86 的整数 DIV 指令，即使在 Haswell 等现代 Intel CPU 上也是微编码的。但 AMD 则不然； AMD 只需要 1 或 2 个 uops 即可激活整数除法器单元内的所有内容。它不是 DIV 的基础，只是一个实现选择。请参阅我的回答用于测试 Collatz 猜想的 C++ 代码比手写汇编更快 - 为什么？ https://stackoverflow.com/questions/40354978/why-is-this-c-code-faster-than-assembly/40355466#40355466对于数字。

FP 除法也很慢，但被解码为单个微指令，因此不会成为前端的瓶颈。如果 FP 除法很少出现并且不是延迟瓶颈的一部分，那么它可以像乘法一样便宜。（但是，如果执行确实必须等待结果，或者吞吐量出现瓶颈，那么much较慢。）更多内容这个答案 https://stackoverflow.com/questions/4125033/floating-point-division-vs-floating-point-multiplication/45899202#45899202.

整数除法和其他微编码指令会给CPU带来困难，并且产生的效果使代码对齐变得很重要，而其他情况则不然。 https://stackoverflow.com/questions/26907523/branch-alignment-for-loops-involving-micro-coded-instructions-on-intel-snb-famil

要了解有关 x86 CPU 内部结构的更多信息，请参阅x86 /questions/tagged/x86标签维基，特别是Agner Fog 的微架构指南 http://agner.org/optimize/.

David Kanter 对 x86 微架构的深入研究对于理解 uops 所经历的管道也很有用：Core 2 https://www.realworldtech.com/merom/ and 珊迪大桥 https://www.realworldtech.com/sandy-bridge/作为主要的文章，AMD K8 和 Bulldozer 的文章也很有趣，可以进行比较。

RISC 与 CISC 仍然很重要 https://www.realworldtech.com/risc-vs-cisc/（2000 年 2 月）保罗·德蒙 (Paul DeMone)看看 PPro 如何将指令分解为微指令，与 RISC 相比，其中大多数指令已经很简单，只需一步即可通过管道，只有像 ARM 压入/弹出多个寄存器这样的罕见指令需要沿着管道发送多个内容（又名以 RISC 术语进行微编码）。

为了更好地衡量，现代微处理器 90 分钟指南！ http://www.lighterra.com/papers/modernmicroprocessors/对于管道和 OoO exec 的基础知识始终值得推荐。

该术语在与现代 x86 截然不同的上下文中的其他用法

在一些较旧/较简单的 CPU 中，每条指令都经过有效的微编码。例如6502执行了6502条指令通过运行 PLA 解码 ROM 中的一系列内部指令 https://security.stackexchange.com/a/177087/66337。这对于非流水线 CPU 非常有效，其中使用 CPU 不同部分的顺序可能因指令而异。

从历史上看，“微代码”有不同的技术含义，意思是从指令字解码的内部控制信号。特别是在像 MIPS 这样的 CPU 中，指令字直接映射到那些控制信号，无需复杂的解码。（我可能有部分错误；我读过类似的内容（除了这个问题的已删除答案之外），但后来找不到了。）

这个含义实际上可能仍然在某些圈子中使用，例如设计简单的流水线 CPU 时，例如业余爱好 MIPS。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

什么是微编码指令？的相关文章

x86 Assembly：很难找到无限循环挑战的想法

我打算和我的朋友们进行一场类似于 corewars 的比赛我们使用与原始游戏相同的内存网格在游戏中我们每个人都应该写一个保险箱它是一个不超过 25 行的无限循环每个安全都有一个技巧或代码可以停止循环从而破坏安全例如 S
大端和小端表示

如果我写以下内容 section data align 4 X db 1 Y dw 5 Z db 0x11 section text add dword X 0xAA000101 我试图理解大端和小端表示之间的差异但我不明白每个表示的每个
什么是微编码指令？

我看过很多参考微编码指令的文献这些是什么以及为什么使用它们 CPU 读取机器代码并将其解码为内部控制信号将正确的数据发送到正确的执行单元大多数指令映射到一个内部操作并且可以直接解码例如在 x86 上 add eax edx只是将
NOP 雪橇如何工作？

我找不到回答这个问题的好来源我知道 nop sled 是一种用于规避缓冲区溢出攻击中堆栈随机化的技术但我无法理解它是如何工作的有什么简单的例子可以说明这种方法 128 字节 nop sled 等术语是什么意思有些攻击包括使程序跳转到
将 C 转换为 MIPS - 嵌套数组

我正在学习 MIPS 汇编语言在书中看到了这个例子对我来说这似乎是不正确的如果是的话这将不是我在本书中发现的第一个错误变量f and g被分配寄存器 s0 and s1分别是数组的基地址A and B are s6 and s7分
我试图在 AAM 指令之后使用 AX 中存储的值将其除以 2，为什么它不适用于 2 位数字输出？

英语不是我的母语请原谅输入错误我将在此处显示的代码是一项作业我真的需要了解发生了什么事我在 DosBox 0 74 和 TASM 汇编器中使用 Intel 8086 语法当我必须除以 2 时代码的问题在于三角形的面积注意程序
MASM 字符串反转

好吧我正在讨论这个问题可能是一个非常复杂的解决方案但这是我脑海中浮现的第一件事我需要编写一个汇编语言程序来反转源字符串而不使用目标字符串临时变量这是我的尝试 INCLUDE Irvine32 inc data sour
汇编编程语言：程序仅当输入为 ESC 时退出，并在退出前要求确认（y/n），否则循环

我只是汇编语言编程的初学者我们的第一个任务是让程序仅在输入为 ESC 时退出退出之前请求确认 y n 否则循环我知道 ESC 在 ASCII 代码中具有等效值但我对插入位置或是否需要添加更多内容感到困惑请帮我这是程序 model
ARM 调用约定是否允许函数不将 LR 存储到堆栈中？

正如标题所示我在理解 ARM 架构的调用约定时遇到问题特别是我仍然很难知道当你调用子程序时 LR 寄存器会发生什么我认为当您进入子程序时处理 LR 寄存器的最明显最安全的方法是将其存储到堆栈中但该行为没有出现在文档中因此我
DASM 汇编器中的 ASCII 到 C64 屏幕代码

我正在通过 C64 模拟器学习 6502 micro 的汇编目前正在尝试将字符串输出到屏幕这是我的代码 processor 6502 org 1000 ldx 00 using x register as column counter
大师系统要求

我们将使用 Virtuoso 来存储 RDF 三重计数一开始将为 1 亿我需要知道典型的 RAM CPU 磁盘等应该是什么查询将使用 SPARQL 并且查询会有点复杂请提供您的意见 Virtuoso 版本 6 x 三元组四元组的平
为什么这个 C++ 包装类没有被内联掉？

EDIT 我的构建系统出了问题我还在弄清楚到底是什么但是gcc产生了奇怪的结果尽管它是 cpp文件但是一旦我使用了g 然后它按预期工作对于我一直遇到麻烦的事情来说这是一个非常精简的测试用例其中使用数字包装类我认为会内联使我
什么时候汇编比C更快？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的
如何让c代码执行hex机器代码？

我想要一个简单的 C 方法能够在 Linux 64 位机器上运行十六进制字节码这是我的 C 程序 char code x48 x31 xc0 include
orpd等SSE2指令有什么意义？

The orpd指令是压缩双精度浮点值的按位逻辑或这不是做完全相同的事情吗por 按位逻辑或如果是这样拥有它还有什么意义呢请记住 SSE1orps https www felixcloutier com x86 orps首先实
为什么 Solaris 汇编器生成的机器代码与 GNU 汇编器在这里不同？

我为 amd64 编写了这个小汇编文件对于这个问题来说代码的作用并不重要 globl fib fib mov edi ecx xor eax eax jrcxz 1f lea 1 rax ebx 0 add rbx rax xchg r
汇编基础知识：输出寄存器值

我刚刚开始学习汇编语言我已经陷入了在屏幕上显示存储在寄存器中的十进制值的部分我使用 emu8086 任何帮助将不胜感激 model small Specifies the memory model used for program
近调用/跳转表并不总是在引导加载程序中工作

一般问题我一直在开发一个简单的引导加载程序并在某些环境中偶然发现了一个问题在这些环境中此类指令不起作用 mov si call tbl SI Call table pointer call call tbl Call print c
减法进位标志

我正在使用 MASM32 有了这个代码 mov eax 5 sub eax 10 CF 状态标志将被设置但使用我的铅笔和纸我实际上看到 MSB 没有任何进位是的我知道从较少的数字中减去大的数字集CF 但我想知道为什么因为使用这段代
在 x86-64 CPU 上通过交叉修改代码重现意外行为

Question 对于可能在 x86 或 x86 x64 系统上触发意外行为的交叉修改代码有哪些想法在这些系统中交叉修改代码中的所有操作均已正确完成但在执行处理器之前执行序列化指令除外修改代码如下所述我有一个 Core 2 Duo

随机推荐

手势识别器和 TableView

我有一个 UIView 覆盖了 UITableView 的所有内容 UIView 使用手势识别器来控制表格显示的内容我仍然需要垂直 UITableView 滚动和行点击我如何将这些从手势识别器传递到桌子上如果您需要知道单元格的索引路径
为什么使用 $PATH 以及它是什么

我对编程有点陌生不是真的但我仍在学习我们不是吗虽然我了解 Java 和 Python 并且了解 C C JS C HTML CSS 等并且我可以在终端中很好地导航但我不熟悉终端中的 PATH 是什么我使用 Linux 终端和
键路径值类型“Int”无法转换为上下文类型“String”

我试图将包含 KeyPath 和排序顺序类型的多个元组传递给应该进行排序的方法我有这个方法 extension Array mutating func sort
使用 Python 的内置 .csv 模块进行编写

请注意这是一个与已经回答的问题不同的问题如何使用 Python 的内置 csv writer 模块替换列 https stackoverflow com questions 1019200 how to replace a column
部署 Qt Quick 演示应用程序 Minehunt 时出现全白屏幕

为了测试部署过程我尝试部署附带的演示应用程序 Minehunt 我能够让它运行没有崩溃或错误但屏幕是全白的我相信这通常意味着我缺少插件 Dependency walker 报告没有问题我什至尝试包含 Qt MingW 插件目录中的
Start-Job - 实时检索输出

我们通过以下方式启动 Powershell 函数Start Job并希望实时检索调用者的输出有没有一种好的方法可以在不打电话的情况下做到这一点Retrieve Job在循环中尝试这样的事情 appJob Start Job foreac
对等网络应用程序的网络发现

我希望有两个类一个服务器类和一个客户端类服务器类应该接收每个新客户端的 IP 地址和端口号并将它们存储在列表中它应该为每个客户端提供已连接客户端及其 IP 地址的列表然后客户端可以使用 TCP 连接相互通信问题是客户端不知道服务
查找集合中的所有对象 Java Mongodb

下面的代码查找集合中的第一个文档 package database import com mongodb BasicDBObject import com mongodb BulkWriteOperation import com mong
使用 Python 从原始帧创建 MPEG4 视频文件

我有一个原始视频帧源我可以在 Python 中访问它我想用它创建一个 MPEG4 视频并带有 MP3 背景音乐 Python 中有哪些类型的工具和库可用于此类任务最好我想要一个 API 我可以为其提供输出文件名然后将各个帧作为 2
Aureliajs 等待应用程序构造函数上的数据

我正在 aureliajs 中开发一个应用程序开发过程已经开始了好几个月现在后端开发人员希望对其服务进行版本控制因此我有一个 Web 服务可以调用来获取每个服务器端 Web api 应用程序的版本然后对于进一步的请求调用正确的
更好的德尔福印地 2007

使用 Delphi 2007 附带的默认 indy10 或将其升级到最新快照版本哪个更好为什么谢谢始终保持最新版本它包含错误修复如果您报告 Delphi 提供的库存版本存在问题您将得到的第一个建议是升级到最新版本因为您的错误可
如何在选择自定义 UITableViewCell 时获取触摸坐标？

当我触摸触摸 UITableViewCell 时我的 ViewController 的 UITableViewDelegate 方法 void tableView UITableView tableView didSelectRowAt
整数包装对象仅在值 127 内共享相同的实例？ [复制]

这个问题在这里已经有答案了这里它们是同一个实例 Integer integer1 127 Integer integer2 127 System out println integer1 integer2 outputs true 但这里
在 ASP.NET 中通过 AJAX 使用后台工作程序

我需要执行一项后台任务该任务有一个显示完成百分比的进度条和一个取消按钮撇开任务细节不谈现在我只想让一个示例正常工作因此我只有三个主要事件处理程序 DoWork ProgressChanged 和 RunWorkerComplete
检查 401，然后重定向 Angularjs，但仅在某些路由上

我有一个很好的角度服务可以通过查看服务器是否返回 401 错误消息来检查用户是否登录如果是用户将被重定向到登录页面这很有效但问题是它对于我的所有页面来说都是完全全局的我有一条特殊路线位于 explore 顺便说一句使用 UI
使用 C# 更新 json 文件中的属性

我希望更改 json 文件中每个 json 记录的特定属性当方法完成执行时我想将 Completed 属性更改为 true 我的 json 文件如下所示 LoanRecords LoanGUID 70dbec7e 5e94 460d 8
如何将 AFHTTPClient、Afnetworking 1.0 迁移到 2.0

我的问题是我有一个旧代码我不知道如何更改它我有 1 个名为 API HTTPClient 的类我对 2 个方法有问题因为我不知道如何将它们放入 2 0 中这 void commandWithParams NSMutableDict
windows 10 本机构建错误 - Windows 上的本机映像构建当前仅支持目标架构：AMD64（不支持 x86）

我正在测试一个新项目并尝试使用 Gluon 来实现此目的 ATM 我正在 Windows 10 上使用 AMD Ryzen 7 进行构建按照以下指示 https docs gluonhq com platforms windows ht
如何使用 Spring Security 保护混合 Spring MVC + Flex 应用程序

我尝试在 Spring 论坛上询问这个问题 http forum springsource org showthread php 109948 Problem configuring spring security 3 1 with hyb
什么是微编码指令？

我看过很多参考微编码指令的文献这些是什么以及为什么使用它们 CPU 读取机器代码并将其解码为内部控制信号将正确的数据发送到正确的执行单元大多数指令映射到一个内部操作并且可以直接解码例如在 x86 上 add eax edx只是将

什么是微编码指令？

该术语在与现代 x86 截然不同的上下文中的其他用法

什么是微编码指令？ 的相关文章

随机推荐

热门标签

什么是微编码指令？的相关文章