一.汇编语法
1. GNU 汇编语法适用于所有的架构,并不是
ARM
独享的,
GNU
汇编由一系列的语句组成,
每行一条语句,每条语句有三个可选部分,如下:
label:
instruction @ comment
label
即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到
指令的地址,标号也可以用来表示数据地址。注意
label
后面的“:”,任何以“:”结尾的标识
符都会被识别为一个标号。
instruction
即指令,也就是汇编指令或伪指令。
@
符号,表示后面的是注释,就跟
C
语言里面的“
/*
”和“
*/
”一样,其实在
GNU
汇编文
件中我们也可以使用“
/*
”和“
*/
”来注释。
comment
就是注释内容。
比如如下代码:
add:
MOVS R0, #0X12 @设置 R0=0X12
上面代码中“
add:
”就是标号,“
MOVS R0,#0X12
”就是指令,最后的“
@
设置
R0=0X12
”就是
注释。
注意!
ARM
中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用
小写,但是不能大小写混用。
用户可以使用
.section 伪操作来定义一个段,汇编系统预定义了一些段名:
.text 表示代码段。
.data 初始化的数据段。
.bss 未初始化的数据段。
.rodata 只读数据段。
我们当然可以自己使用
.section
来定义一个段,每个段以段名开始,以下一段名或者文件结
尾结束,比如:
.section .testsection @定义一个
testsetcion
段
汇编程序的默认入口标号是
_start
,不过我们也可以在链接脚本中使用
ENTRY
来指明其它
的入口点,下面的代码就是使用
_start
作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上面代码中
.global
是伪操作,表示
_start
是一个全局标号,类似
C
语言里面的全局变量一
样,常见的伪操作有:
.byte 定义单字节数据,比如.byte 0x12。
.short 定义双字节数据,比如.short 0x1234。
.long 定义一个 4 字节数据,比如
.long 0x12345678
。
·.equ 赋值语句,格式为:.equ 变量名,表达式,比如.equ num, 0x12
,表示
num=0x12
。
.align 数据字节对齐,比如:
.align 4
表示
4
字节对齐。
.end 表示源文件结束。
.global 定义一个全局符号,格式为:.global symbol
,比如:
.global _start
。
GNU
汇编还有其它的伪操作,但是最常见的就是上面这些,如果想详细的了解全部的伪操
作,可以参考《
ARM Cortex-A(armV7)
编程手册
V4.0.pdf
》的
57
页。
GNU
汇编同样也支持函数,函数格式如下:
函数名:
函数体
返回语句
GNU
汇编函数返回语句不是必须的,如下代码就是用汇编写的
Cortex-A7
中断服务函数:
示例代码 7.1.1.1 汇编函数定义
/* 未定义中断 */
Undefined_Handler:
ldr r0, =Undefined_Handler
bx r0
/* SVC 中断 */
SVC_Handler:
ldr r0, =SVC_Handler
bx r0
/* 预取终止中断 */
PrefAbort_Handler:
ldr r0, =PrefAbort_Handler
bx r0
上述代码中定义了三个汇编函数:
Undefined_Handler
、
SVC_Handler
和 PrefAbort_Handler。以函数
Undefined_Handler
为例我们来看一下汇编函数组成, “Undefined_Handler
”就是函数名,“
ldr r0, =Undefined_Handler
”是函数体,“
bx r0
”是函数 返回语句,“bx
”指令是返回指令,函数返回语句不是必须的。
二.常用指令
1.处理器内部数据传输指令
1.1
、
MOV
指令
MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄
存器里面,使用示例如下:
MOV R0,R1 @将寄存器
R1
中的数据传递给
R0
,即
R0=R1
MOV R0, #0X12 @将立即数
0X12
传递给
R0
寄存器,即
R0=0X12
1.2
、
MRS
指令
MRS 指令用于将特殊寄存器
(
如
CPSR
和
SPSR)
中的数据传递给通用寄存器,要读取特殊
寄存器的数据只能使用
MRS
指令!使用示例如下:
MRS R0, CPSR
@将特殊寄存器
CPSR
里面的数据传递给
R0
,即
R0=CPSR
1.3
、
MSR
指令
MSR 指令和
MRS
刚好相反,
MSR
指令用来将普通寄存器的数据传递给特殊寄存器,也就
是写特殊寄存器,写特殊寄存器只能使用 MSR
,使用示例如下:
MSR CPSR, R0 @将
R0
中的数据复制到
CPSR
中,即
CPSR=R0
2.
存储器访问指令
ARM 不能直接访问存储器,比如
RAM
中的数据,
I.MX6UL
中的寄存器就是
RAM
类型
的,我们用汇编来配置
I.MX6UL
寄存器的时候需要借助存储器访问指令,一般先将要配置的值
写入到
Rx(x=0~12)
寄存器中,然后借助存储器访问指令将
Rx
中的数据写入到
I.MX6UL
寄存器
中。读取
I.MX6UL
寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种:
LDR
和
STR
,用法如表
所示:
2.1
、
LDR
指令
LDR 主要用于从存储加载数据到寄存器
Rx
中,LDR 也可以将一个立即数加载到寄存器
Rx
中,
LDR
加载立即数的时候要使用“
=
”,而不是“
#
”。在嵌入式开发中,
LDR
最常用的就是读 取 CPU
的寄存器值,比如
I.MX6UL
有个寄存器
GPIO1_GDIR
,其地址为
0X0209C004
,我们现在要读取这个寄存器中的数据,示例代码如下:
示例代码 LDR 指令使用
1
LDR R0
, =
0X0209C004
@
将寄存器地址
0X0209C004
加载到
R0
中,即
R0
=
0X0209C004
2
LDR R1
, [
R0
]
@
读取地址
0X0209C004
中的数据到
R1
寄存器中
上述代码就是读取寄存器 GPIO1_GDIR
中的值,读取到的寄存器值保存在
R1
寄存器中,
上面代码中
offset
是
0
,也就是没有用到
offset
。
2.2
、
STR
指令
LDR 是从存储器读取数据,
STR
就是将数据写入到存储器中,同样以
I.MX6UL
寄存GPIO1_GDIR 为例,现在我们要配置寄存器
GPIO1_GDIR
的值为
0X20000002
,示例代码如下:
示例代码 STR 指令使用
1
LDR R0
, =
0X0209C004
@
将寄存器地址
0X0209C004
加载到
R0
中,即
R0
=
0X0209C004
2
LDR R1
, =
0X20000002
@R1
保存要写入到寄存器的值,即
R1
=
0X20000002
3
STR R1
, [
R0
]
@
将
R1
中的值写入到
R0
中所保存的地址中
LDR 和
STR
都是按照字进行读取和写入的,也就是操作的
32
位数据,如果要按照字节半字进行操作的话可以在指令“LDR
”后面加上
B
或
H
,比如按字节操作的指令就是
LDRB
和
STRB
,按半字操作的指令就是
LDRH
和
STRH.
3.压栈和出栈指令
我们通常会在 A
函数中调用
B
函数,当
B
函数执行完以后再回到
A
函数继续执行。要想 再跳回 A
函数以后代码能够接着正常运行,那就必须在跳到
B
函数之前将当前处理器状态保存 起来(
就是保存
R0~R15
这些寄存器值
)
,当
B
函数执行完成以后再用前面保存的寄存器值恢复 R0~R15 即可。保存
R0~R15
寄存器的操作就叫做现场保护,恢复
R0~R15
寄存器的操作就叫做 恢复现场。在进行现场保护的时候需要进行压栈(
入栈
)
操作,恢复现场就要进行出栈操作。压栈 的指令为 PUSH
,出栈的指令为
POP
,
PUSH
和
POP
是一种多存储和多加载指令,即可以一次 操作多个寄存器数据,他们利用当前的栈指针 SP
来生成地址,
PUSH
和
POP
的用法如表 所示:
假如我们现在要将
R0~R3
和
R12
这
5
个寄存器压栈,当前的
SP
指针指向
0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
PUSH {R0~R3, R12} @将
R0~R3
和
R12
压栈
POP {LR} @先恢复 LR
POP {R0~R3,R12} @在恢复
R0~R3,R12
出栈的就是从栈顶,也就是
SP
当前执行的位置开始,地址依次减小来提取堆栈中的数据
到要恢复的寄存器列表中。
PUSH
和
POP
的另外一种写法是“
STMFD SP
!”和“
LDMFD SP!
”,
因此上面的汇编代码可以改为:
示例代码 7.2.3.1 STMFD 和 LDMFD 指令
1 STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
2 STMFD SP!,{LR} @LR 入栈
3
4 LDMFD SP!, {LR} @先恢复 LR
5 LDMFD SP!, {R0~R3, R12} @再恢复 R0~R3, R12
STMFD 可以分为两部分:
STM
和
FD
,同理,
LDMFD
也可以分为
LDM
和
FD
。看到
STM
和
LDM
有没有觉得似曾相识
(
不是
STM32
啊啊啊啊
)
,前面我们讲了
LDR
和
STR
,这两个是
数据加载和存储指令,但是每次只能读写存储器中的一个数据。
STM
和
LDM
就是多存储和多
加载,可以连续的读写存储器中的多个连续数据。
FD 是
Full Descending
的缩写,即满递减的意思。根据
ATPCS
规则
,ARM
使用的
FD
类型
的堆栈,
SP
指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长
的堆栈,因此最常用的指令就是
STMFD
和
LDMFD
。
STM
和
LDM
的指令寄存器列表中编号
小的对应低地址,编号高的对应高地址。
4. 跳转指令
4.1
、
B
指令
这是最简单的跳转指令,B
指令会将
PC
寄存器的值设置为跳转目标地址, 一旦执行 B
指 令,ARM
处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行
处,那就可以用
B
指令,如下示例:
,那就可以用 B 指令,如下示例:
示例代码 7.2.4.1 B 指令示例
1 _start:
2
3 ldr sp,=0X80200000 @设置栈指针
4 b main @跳转到 main 函数
上述代码就是典型的在汇编中初始化 C 运行环境
上述代码就是典型的在汇编中初始化 C 运行环境,然后跳转到 C 文件的 main 函数中运行,上述代码只是初始化了 SP 指针,有些处理器还需要做其他的初始化,比如初始化 DDR 等等。 因为跳转到 C 文件以后再也不会回到汇编了,所以在第 4 行使用了 B 指令来完成跳转。
4.2
、
BL
指令
BL 指令相比
B
指令,在跳转之前会在寄存器
LR(R14)
中保存当前
PC
寄存器值,所以可以
通过将
LR
寄存器中的值重新加载到
PC
中来继续从跳转之前的代码处运行,这是子程序调用
一个基本但常用的手段。比如
Cortex-A
处理器的
irq
中断服务函数都是汇编写的,主要用汇编
来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是
C
函数,所以就会存
在汇编中调用
C
函数的问题。而且当
C
语言版本的中断处理函数执行完成以后是需要返回到
irq
汇编中断服务函数,因为还要处理其他的工作,一般是恢复现场。这个时候就不能直接使用
B
指令了,因为
B
指令一旦跳转就再也不会回来了,这个时候要使用
BL
指令,示例代码如下:
示例代码 7.2.4.2 BL 指令示例
1 push {r0, r1} @保存 r0,r1
2 cps #0x13 @进入 SVC 模式,允许其他中断再次进去
3
5 bl system_irqhandler @加载 C 语言中断处理函数到 r2 寄存器中
6
7 cps #0x12 @进入 IRQ 模式
8 pop {r0, r1}
9 str r0, [r1, #0X10] @中断执行完成,写 EOIR
上述代码中第 5
行就是执行
C
语言版的中断处理函数,当处理完成以后是需要返回来继续
执行下面的程序,所以使用了
BL
指令。
5.1
算术运算指令
6.1 逻辑运算指令
我们用 C
语言进行
CPU
寄存器配置的时候常常需要用到逻辑运算符号,比如“
&
”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令,常用的运算指令用法如表 7.2.6.1
所示