【CPU 架构】x86、x86_64、x64、arm64、aarch64

2023-12-05

1.服务器分类

按照 CPU 体系架构来区分,服务器主要分为两类:

  • 非 x86 服务器 :使用 RISC( 精简指令集 )或 EPIC( 并行指令代码 )处理器,并且主要采用 UNIX 和其它专用操作系统的服务器,指令系统相对简单,它只要求硬件执行很有限且最常用的那部分执令,CPU 主要有 Compaq 的 Alpha 、HP 的 PA-RISC 、IBM 的 Power PC 、MIPS 的 MIPS 和 SUN 的 Sparc 、Intel 研发的 EPIC 安腾处理器等。这种服务器价格昂贵,体系封闭,但是稳定性好,性能强,主要用在金融、电信等大型企业的核心系统。
  • x86 服务器 :又称 CISC( 复杂指令集 )架构服务器,即通常所讲的 PC 服务器,它是基于 PC 机体系结构,使用 Intel 或其它兼容 x86 指令集的处理器芯片的服务器。目前主要为 Intel 的 Xeon E3 E5 E7 系列,价格相对便宜、兼容性好、稳定性较差、安全性不算太高。

在这里插入图片描述

2.CPU 架构

CPU 架构: x86 架构 arm 架构

  • Intel(英特尔)与 AMD(超威半导体)是 x86 架构 CPU 制造商。
  • ARM 公司是 arm 架构 CPU 制造商。

2.1 x86 架构:x86、x86_64、x64

  • x86 x86_64 :基于 x86 架构的不同版本, 位数不同 32 32 32 位和 64 64 64
  • x86 版本是 Intel 率先研发出 x86 架构。
  • x86_64 版本(也称 x64 )是 x86 64 64 64 位版本,由 AMD 率先研发,所以 x86_64 也叫 amd64
  • x86_64 = x64 = amd64

2.2 arm 架构:arm64 和 aarch64

  • arm64 = aarch64
  • arm 的历史遗留问题, arm64 aarch 都曾代指过 64 64 64 arm 程序,目前 arm64 aarch64 概念已合并,新版 64 64 64 arm 程序统称 aarch64

在这里插入图片描述

3.发展历史

x86 是指 Intel 开发的一种 32 32 32 位指令集,从 386 386 386 开始时代开始的,一直沿用至今,是一种 CISC 指令集,所有 Intel 早期的 CPU,AMD 早期的 CPU 都支持这种指令集,Intel 官方文档里面称为 IA-32

x86 CPU 开始迈向 64 64 64 位的时候有 2 2 2 种选择:

  • 向下兼容 x86
  • 完全重新设计指令集,不兼容 x86

AMD 抢跑了,比 Intel 率先制造出了商用的兼容 x86 的 CPU,AMD 称之为 amd64 ,抢了 64 64 64 位 PC 的第一桶金,得到了用户的认同。

Intel 选择了设计一种不兼容 x86 的全新 64 64 64 位指令集,称之为 IA-64 (这玩意似乎就是安腾),但是比 AMD 晚了一步,而且 IA-64 也挺惨淡的,因为是全新设计的 CPU,没有编译器,也不支持 Windows(微软把 Intel 给忽悠了,承诺了会出安腾版 windows server 版,但是迟迟拿不出东西)。后来不得不在时机落后的情况下也开始支持 amd64 的指令集,但是换了个名字,叫 x86_64 ,表示是 x86 指令集的 64 64 64 扩展,大概是不愿意承认这玩意是 AMD 设计出来的。

实际上, x86_64 x64 AMD64 基本上是同一个东西,我们现在用的 Intel / AMD 的桌面级 CPU 基本上都是 x86_64 ,与之相对的 arm ppc 等都不是 x86_64

x86 x86_64 主要的区别就是 32 32 32 位和 64 64 64 位的问题, x86 中只有 8 8 8 32 32 32 位通用寄存器: eax ebx ecx edx ebp esp esi edi

x86_64 把这 8 8 8 个通用寄存器扩展成了 64 64 64 位的,并且比 x86 增加了若干个寄存器(好像增加了 8 8 8 个,变成了总共 16 16 16 个通用寄存器)。同样的 MMX(MultiMedia eXtensions,多媒体扩展)的寄存器的位数和数量也进行了扩展。此外 CPU 扩展到 64 64 64 位后也能支持更多的内存了,等等许多好处。

对于普通程序来说,CPU 位数的扩展、寄存器数量的增加不会带来明显的性能提升,比如 IE 浏览器、Office 办公这类的软件。特定的程序很能够充分利用 64 64 64 位 CPU、更多的寄存器带来的优势,比如 MMX 除了能提升多媒体程序的性能,对矩阵、多项式、向量计算都能带来提升,更多的 MMX 寄存器、更大的寄存器字长都有利于 SIMD 指令的执行,能够提升 CPU 对数据的吞吐量(RISC 指令集的 CPU 动不动就有数百个寄存器,可以有效的缓存中间计算结果,不需要把中间结果写入内存,从而减少内存访问次数,显著提升性能)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【CPU 架构】x86、x86_64、x64、arm64、aarch64 的相关文章

  • FASM 是否使用 Intel 语法?

    我尝试在 FASM 中编译以下代码 mov DWORD PTR ebp 4 1234567 它给了我一个 无效表达式 错误 但是以下代码有效 mov DWORD ebp 4 1234567 那么 FASM 是否使用 Intel 语法 我假设
  • 从地址获取上一条指令的开头

    我们在缓冲区中查看 x86 操作码 标记当前指针 68 0F 00 6A 90 00 找到下一条指令的开始很容易 因为电流的大小是可以确定的 但是你如何才能准确地猜出前一个的开始呢 68 0F 00 6A 90 总共 5 个字节 结束于 0
  • 处理负整数的汇编 MASM

    我被指示用汇编语言编写一个程序 该程序将执行以下算术 A B C D A E 当没有负值发挥作用时 我成功地做到了这一点 但假设 A 5 B 4 C 3 D 2 和 E 1 这给了我们 5 4 3 2 5 1 或 6 这就是我需要帮助的地方
  • 如何根据CPU能力实现渲染器

    我想知道在 JavaScript 中实现渲染器的最佳方法是什么 这里真正重要的并不是渲染的内容部分 我更想知道何时以及如何有效地运行渲染器代码 目前 我有window setInterval renderFunc 1000 20 每 50
  • 比较堆栈中的两个值? [复制]

    这个问题在这里已经有答案了 我卡住了 在我的汇编代码中 我想比较两个值 堆 x86 语法 AT T cmpl 4 ebp 4 ebp 错误 cmp 的内存引用太多 我认为不可能根据乘数和 ebp 来比较两个值 有什么建议 您可以使用 CMP
  • 获取比较指令的值

    据我了解 cmp 指令将设置标志寄存器中的一些位 然后 您可以使用 jle jnp 等指令基于这些指令进行分支 我想知道如何从比较中恢复整数值 示例 以下是有效的 c 语法 y x a gt 13 因此 a 与 13 进行比较 得到 tru
  • 英特尔® 事务同步扩展新指令 (TSX-NI) 与英特尔 TSX 有何不同?

    我在Intel的页面上找到了 https ark intel com products 97123 Intel Core i5 7500 Processor 6M Cache up to 3 80 GHz https ark intel c
  • 推送 64 位 intel osx

    我想将 64 位地址压入堆栈 如下所示 asm pushq 0x1122334455667788 但我得到编译错误 我只能按以下方式推送 asm pushq 0x11223344 有人可以帮助我理解我的错误吗 我是装配新手 所以如果我的问题
  • 如何获取 VESA BIOS 信息

    我正在跟踪Phil Opp 教程 https os phil opp com 关于用 Rust 编写一个操作系统 在稍微尝试了一下之后 我想在屏幕上显示真实的图形 我发现我应该从使用带有 VESA 的线性帧缓冲区开始 我在 osdev or
  • C/C++ 中的简单“Hello World”内联汇编语言程序

    我使用 devcpp 和 borland c 编译器 asm mov ax 4 I O Func mov bx 1 Output func mov cx name address of the string mov dx 6 length
  • 通过 C 将线程固定到 cpuset 中的核心

    我有 cgroup cpuset set1 set1有2 5 8 我想将一个进程绑定到该 cpuset 然后将该进程中的一个线程固定到核心 4 cpuset 的名称 线程名称以及我应该将线程绑定到的核心位于 m 配置文件中 是否有任何 C
  • 预取双类成员需要转换为 char*?

    我有一个正在使用的课程 mm prefetch 预先请求包含 double 类型的类成员的缓存行 class MyClass double getDouble return dbl other members double dbl othe
  • 如何让c代码执行hex机器代码?

    我想要一个简单的 C 方法能够在 Linux 64 位机器上运行十六进制字节码 这是我的 C 程序 char code x48 x31 xc0 include
  • orpd等SSE2指令有什么意义?

    The orpd指令是 压缩双精度浮点值的按位逻辑或 这不是做完 全相同的事情吗por 按位逻辑或 如果是这样 拥有它还有什么意义呢 请记住 SSE1orps https www felixcloutier com x86 orps首先 实
  • 如何在汇编语言中换行打印多个字符串

    我试图在汇编中的不同行上打印多个字符串 但使用我的代码 它只打印最后一个字符串 我对汇编语言非常陌生 所以请耐心等待 section text global start start mov edx len mov edx len1 mov
  • NASM 轮班操作员

    您将如何在寄存器上进行 NASM 中的位移位 我读了手册 它似乎只提到了这些操作员 gt gt lt lt 当我尝试使用它们时 NASM 抱怨移位运算符处理标量值 您能解释什么是标量值并举例说明如何使用 gt gt and lt lt 另外
  • Nasm 打印到下一行

    我用 nasm Assembly 编写了以下程序 section text global start start Input variables mov edx inLen mov ecx inMsg mov ebx 1 mov eax 4
  • 从 NASM 调用 C 函数 _printf 会导致分段错误

    我一直在尝试使用 NASM 在 Mac OS 和 Windows 上学习 64 位汇编 我的代码是 extern printf section data msg db Hello World 10 0 section text global
  • 为什么我的空循环在 Intel Skylake CPU 上作为函数调用时运行速度是原来的两倍?

    我正在运行一些测试来比较 C 和 Java 并遇到了一些有趣的事情 在 main 调用的函数中 而不是在 main 本身中 运行具有优化级别 1 O1 的完全相同的基准代码 导致性能大约翻倍 我正在打印 test t 的大小 以毫无疑问地验
  • 如何在 Linux x86_64 上模拟 iret

    我正在编写一个基于 Intel VT 的调试器 由于当 NMI Exiting 1 时 iret 指令在 vmx guest 中的性能发生了变化 所以我应该自己处理vmx主机中的NMI 否则 guest会出现nmi可重入错误 我查了英特尔手

随机推荐