汇编基础知识

2023-11-02

一.汇编语法

1. GNU 汇编语法适用于所有的架构，并不是 ARM 独享的， GNU 汇编由一系列的语句组成，

每行一条语句，每条语句有三个可选部分，如下：

label： instruction @ comment

label 即标号，表示地址位置，有些指令前面可能会有标号，这样就可以通过这个标号得到

指令的地址，标号也可以用来表示数据地址。注意 label 后面的“：”，任何以“：”结尾的标识

符都会被识别为一个标号。

instruction 即指令，也就是汇编指令或伪指令。

@ 符号，表示后面的是注释，就跟 C 语言里面的“ /* ”和“ */ ”一样，其实在 GNU 汇编文

件中我们也可以使用“ /* ”和“ */ ”来注释。

comment 就是注释内容。

比如如下代码：

add:

MOVS R0, #0X12 @设置 R0=0X12

上面代码中“ add: ”就是标号，“ MOVS R0,#0X12 ”就是指令，最后的“ @ 设置 R0=0X12 ”就是

注释。

注意！ ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写，也可以全部使用

小写，但是不能大小写混用。

用户可以使用 .section 伪操作来定义一个段，汇编系统预定义了一些段名：

.text 表示代码段。

.data 初始化的数据段。

.bss 未初始化的数据段。

.rodata 只读数据段。

我们当然可以自己使用 .section 来定义一个段，每个段以段名开始，以下一段名或者文件结

尾结束，比如：

.section .testsection @定义一个 testsetcion 段

汇编程序的默认入口标号是 _start ，不过我们也可以在链接脚本中使用 ENTRY 来指明其它

的入口点，下面的代码就是使用 _start 作为入口标号：

.global _start

_start:

ldr r0, =0x12 @r0=0x12

上面代码中 .global 是伪操作，表示 _start 是一个全局标号，类似 C 语言里面的全局变量一

样，常见的伪操作有：

.byte 定义单字节数据，比如.byte 0x12。

.short 定义双字节数据，比如.short 0x1234。

.long 定义一个 4 字节数据，比如 .long 0x12345678 。

·.equ 赋值语句，格式为：.equ 变量名，表达式，比如.equ num, 0x12 ，表示 num=0x12 。

.align 数据字节对齐，比如： .align 4 表示 4 字节对齐。

.end 表示源文件结束。

.global 定义一个全局符号，格式为：.global symbol ，比如： .global _start 。

GNU 汇编还有其它的伪操作，但是最常见的就是上面这些，如果想详细的了解全部的伪操

作，可以参考《 ARM Cortex-A(armV7) 编程手册 V4.0.pdf 》的 57 页。

GNU 汇编同样也支持函数，函数格式如下：

函数名:

函数体

返回语句

GNU 汇编函数返回语句不是必须的，如下代码就是用汇编写的 Cortex-A7 中断服务函数：

示例代码 7.1.1.1 汇编函数定义
/* 未定义中断 */
Undefined_Handler:
 ldr r0, =Undefined_Handler
 bx r0
/* SVC 中断 */
SVC_Handler:
 ldr r0, =SVC_Handler
 bx r0
/* 预取终止中断 */
PrefAbort_Handler:
 ldr r0, =PrefAbort_Handler 
bx r0

上述代码中定义了三个汇编函数： Undefined_Handler 、 SVC_Handler 和 PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看一下汇编函数组成， “Undefined_Handler ”就是函数名，“ ldr r0, =Undefined_Handler ”是函数体，“ bx r0 ”是函数返回语句，“bx ”指令是返回指令，函数返回语句不是必须的。

二.常用指令

1.处理器内部数据传输指令

1.1 、 MOV 指令

MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器，或者将一个立即数传递到寄

存器里面，使用示例如下：

MOV R0，R1 @将寄存器 R1 中的数据传递给 R0 ，即 R0=R1

MOV R0, #0X12 @将立即数 0X12 传递给 R0 寄存器，即 R0=0X12

1.2 、 MRS 指令

MRS 指令用于将特殊寄存器 ( 如 CPSR 和 SPSR) 中的数据传递给通用寄存器，要读取特殊

寄存器的数据只能使用 MRS 指令！使用示例如下：

MRS R0, CPSR

@将特殊寄存器 CPSR 里面的数据传递给 R0 ，即 R0=CPSR

1.3 、 MSR 指令

MSR 指令和 MRS 刚好相反， MSR 指令用来将普通寄存器的数据传递给特殊寄存器，也就

是写特殊寄存器，写特殊寄存器只能使用 MSR ，使用示例如下：

MSR CPSR, R0 @将 R0 中的数据复制到 CPSR 中，即 CPSR=R0

2. 存储器访问指令

ARM 不能直接访问存储器，比如 RAM 中的数据， I.MX6UL 中的寄存器就是 RAM 类型

的，我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令，一般先将要配置的值

写入到 Rx(x=0~12) 寄存器中，然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器

中。读取 I.MX6UL 寄存器也是一样的，只是过程相反。常用的存储器访问指令有两种： LDR 和

STR ，用法如表所示：

2.1 、 LDR 指令

LDR 主要用于从存储加载数据到寄存器 Rx 中，LDR 也可以将一个立即数加载到寄存器 Rx

中， LDR 加载立即数的时候要使用“ = ”，而不是“ # ”。在嵌入式开发中， LDR 最常用的就是读取 CPU 的寄存器值，比如 I.MX6UL 有个寄存器 GPIO1_GDIR ，其地址为 0X0209C004 ，我们现在要读取这个寄存器中的数据，示例代码如下：

示例代码 LDR 指令使用

1 LDR R0 , = 0X0209C004 @ 将寄存器地址 0X0209C004 加载到 R0 中，即 R0 = 0X0209C004

2 LDR R1 , [ R0 ] @ 读取地址 0X0209C004 中的数据到 R1 寄存器中

上述代码就是读取寄存器 GPIO1_GDIR 中的值，读取到的寄存器值保存在 R1 寄存器中，

上面代码中 offset 是 0 ，也就是没有用到 offset 。

2.2 、 STR 指令

LDR 是从存储器读取数据， STR 就是将数据写入到存储器中，同样以 I.MX6UL 寄存GPIO1_GDIR 为例，现在我们要配置寄存器 GPIO1_GDIR 的值为 0X20000002 ，示例代码如下：示例代码 STR 指令使用

1 LDR R0 , = 0X0209C004 @ 将寄存器地址 0X0209C004 加载到 R0 中，即 R0 = 0X0209C004

2 LDR R1 , = 0X20000002 @R1 保存要写入到寄存器的值，即 R1 = 0X20000002

3 STR R1 , [ R0 ] @ 将 R1 中的值写入到 R0 中所保存的地址中

LDR 和 STR 都是按照字进行读取和写入的，也就是操作的 32 位数据，如果要按照字节半字进行操作的话可以在指令“LDR ”后面加上 B 或 H ，比如按字节操作的指令就是 LDRB 和

STRB ，按半字操作的指令就是 LDRH 和 STRH.

3.压栈和出栈指令

我们通常会在 A 函数中调用 B 函数，当 B 函数执行完以后再回到 A 函数继续执行。要想再跳回 A 函数以后代码能够接着正常运行，那就必须在跳到 B 函数之前将当前处理器状态保存起来( 就是保存 R0~R15 这些寄存器值 ) ，当 B 函数执行完成以后再用前面保存的寄存器值恢复 R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护，恢复 R0~R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈( 入栈 ) 操作，恢复现场就要进行出栈操作。压栈的指令为 PUSH ，出栈的指令为 POP ， PUSH 和 POP 是一种多存储和多加载指令，即可以一次操作多个寄存器数据，他们利用当前的栈指针 SP 来生成地址， PUSH 和 POP 的用法如表所示：

假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈，当前的 SP 指针指向 0X80000000，处理器的堆栈是向下增长的，使用的汇编代码如下：

PUSH {R0~R3, R12} @将 R0~R3 和 R12 压栈

POP {LR} @先恢复 LR

POP {R0~R3,R12} @在恢复 R0~R3,R12

出栈的就是从栈顶，也就是 SP 当前执行的位置开始，地址依次减小来提取堆栈中的数据

到要恢复的寄存器列表中。 PUSH 和 POP 的另外一种写法是“ STMFD SP ！”和“ LDMFD SP! ”，

因此上面的汇编代码可以改为：

示例代码 7.2.3.1 STMFD 和 LDMFD 指令
1 STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
2 STMFD SP!,{LR} @LR 入栈
3
4 LDMFD SP!, {LR} @先恢复 LR
5 LDMFD SP!, {R0~R3, R12} @再恢复 R0~R3, R12

STMFD 可以分为两部分： STM 和 FD ，同理， LDMFD 也可以分为 LDM 和 FD 。看到 STM

和 LDM 有没有觉得似曾相识 ( 不是 STM32 啊啊啊啊 ) ，前面我们讲了 LDR 和 STR ，这两个是

数据加载和存储指令，但是每次只能读写存储器中的一个数据。 STM 和 LDM 就是多存储和多

加载，可以连续的读写存储器中的多个连续数据。

FD 是 Full Descending 的缩写，即满递减的意思。根据 ATPCS 规则 ,ARM 使用的 FD 类型

的堆栈， SP 指向最后一个入栈的数值，堆栈是由高地址向下增长的，也就是前面说的向下增长

的堆栈，因此最常用的指令就是 STMFD 和 LDMFD 。 STM 和 LDM 的指令寄存器列表中编号

小的对应低地址，编号高的对应高地址。

4. 跳转指令

4.1 、 B 指令

这是最简单的跳转指令，B 指令会将 PC 寄存器的值设置为跳转目标地址，一旦执行 B 指令，ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行

处，那就可以用 B 指令，如下示例：

，那就可以用 B 指令，如下示例：
示例代码 7.2.4.1 B 指令示例
1 _start:
2
3 ldr sp,=0X80200000 @设置栈指针
4 b main @跳转到 main 函数
上述代码就是典型的在汇编中初始化 C 运行环境

上述代码就是典型的在汇编中初始化 C 运行环境，然后跳转到 C 文件的 main 函数中运行，上述代码只是初始化了 SP 指针，有些处理器还需要做其他的初始化，比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了，所以在第 4 行使用了 B 指令来完成跳转。

4.2 、 BL 指令

BL 指令相比 B 指令，在跳转之前会在寄存器 LR(R14) 中保存当前 PC 寄存器值，所以可以

通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行，这是子程序调用

一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的，主要用汇编

来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数，所以就会存

在汇编中调用 C 函数的问题。而且当 C 语言版本的中断处理函数执行完成以后是需要返回到

irq 汇编中断服务函数，因为还要处理其他的工作，一般是恢复现场。这个时候就不能直接使用

B 指令了，因为 B 指令一旦跳转就再也不会回来了，这个时候要使用 BL 指令，示例代码如下：

示例代码 7.2.4.2 BL 指令示例
1 push {r0, r1} @保存 r0,r1
2 cps #0x13 @进入 SVC 模式，允许其他中断再次进去
3
5 bl system_irqhandler @加载 C 语言中断处理函数到 r2 寄存器中
6
7 cps #0x12 @进入 IRQ 模式
8 pop {r0, r1} 
9 str r0, [r1, #0X10] @中断执行完成，写 EOIR

上述代码中第 5 行就是执行 C 语言版的中断处理函数，当处理完成以后是需要返回来继续

执行下面的程序，所以使用了 BL 指令。

5.1 算术运算指令

6.1 逻辑运算指令

我们用 C 语言进行 CPU 寄存器配置的时候常常需要用到逻辑运算符号，比如“ & ”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令，常用的运算指令用法如表 7.2.6.1 所示

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)