汇编基础知识

2023-11-02

一.汇编语法

1.  GNU 汇编语法适用于所有的架构,并不是 ARM 独享的, GNU 汇编由一系列的语句组成,
每行一条语句,每条语句有三个可选部分,如下:
        label: instruction @ comment
label 即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到
指令的地址,标号也可以用来表示数据地址。注意 label 后面的“:”,任何以“:”结尾的标识
符都会被识别为一个标号。
instruction 即指令,也就是汇编指令或伪指令。
@ 符号,表示后面的是注释,就跟 C 语言里面的“ /* ”和“ */ ”一样,其实在 GNU 汇编文
件中我们也可以使用“ /* ”和“ */ ”来注释。
comment 就是注释内容。
比如如下代码:
        add:
                MOVS R0, #0X12 @设置 R0=0X12
上面代码中“ add: ”就是标号,“ MOVS R0,#0X12 ”就是指令,最后的“ @ 设置 R0=0X12 ”就是
注释。
注意! ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用
小写,但是不能大小写混用。
用户可以使用 .section 伪操作来定义一个段,汇编系统预定义了一些段名:
        .text 表示代码段。
        .data 初始化的数据段。
        .bss 未初始化的数据段。
        .rodata 只读数据段。
我们当然可以自己使用 .section 来定义一个段,每个段以段名开始,以下一段名或者文件结
尾结束,比如:
        .section .testsection @定义一个 testsetcion
汇编程序的默认入口标号是 _start ,不过我们也可以在链接脚本中使用 ENTRY 来指明其它
的入口点,下面的代码就是使用 _start 作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上面代码中 .global 是伪操作,表示 _start 是一个全局标号,类似 C 语言里面的全局变量一
样,常见的伪操作有:
        .byte  定义单字节数据,比如.byte 0x12。
        .short  定义双字节数据,比如.short 0x1234。
        .long  定义一个 4 字节数据,比如 .long 0x12345678
        ·.equ  赋值语句,格式为:.equ 变量名,表达式,比如.equ num, 0x12 ,表示 num=0x12
        .align 数据字节对齐,比如: .align 4 表示 4 字节对齐。
        .end  表示源文件结束。
        .global 定义一个全局符号,格式为:.global symbol ,比如: .global _start
GNU 汇编还有其它的伪操作,但是最常见的就是上面这些,如果想详细的了解全部的伪操
作,可以参考《 ARM Cortex-A(armV7) 编程手册 V4.0.pdf 》的 57 页。
GNU 汇编同样也支持函数,函数格式如下:
    函数名:
        函数体
        返回语句
GNU 汇编函数返回语句不是必须的,如下代码就是用汇编写的 Cortex-A7 中断服务函数:
示例代码 7.1.1.1 汇编函数定义
/* 未定义中断 */
Undefined_Handler:
 ldr r0, =Undefined_Handler
 bx r0
/* SVC 中断 */
SVC_Handler:
 ldr r0, =SVC_Handler
 bx r0
/* 预取终止中断 */
PrefAbort_Handler:
 ldr r0, =PrefAbort_Handler 
bx r0
上述代码中定义了三个汇编函数: Undefined_Handler SVC_Handler 和 PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看一下汇编函数组成, “Undefined_Handler ”就是函数名,“ ldr r0, =Undefined_Handler ”是函数体,“ bx r0 ”是函数 返回语句,“bx ”指令是返回指令,函数返回语句不是必须的。

二.常用指令

1.处理器内部数据传输指令

1.1 MOV 指令
        MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄
存器里面,使用示例如下:
        MOV R0,R1  @将寄存器 R1 中的数据传递给 R0 ,即 R0=R1
        MOV R0, #0X12   @将立即数 0X12 传递给 R0 寄存器,即 R0=0X12
1.2 MRS 指令
        MRS 指令用于将特殊寄存器 ( CPSR SPSR) 中的数据传递给通用寄存器,要读取特殊
寄存器的数据只能使用 MRS 指令!使用示例如下:
        MRS R0, CPSR
        @将特殊寄存器 CPSR 里面的数据传递给 R0 ,即 R0=CPSR
1.3 MSR 指令
        MSR 指令和 MRS 刚好相反, MSR 指令用来将普通寄存器的数据传递给特殊寄存器,也就
        是写特殊寄存器,写特殊寄存器只能使用 MSR ,使用示例如下:
        MSR CPSR, R0  @将 R0 中的数据复制到 CPSR 中,即 CPSR=R0
2. 存储器访问指令
        ARM 不能直接访问存储器,比如 RAM 中的数据, I.MX6UL 中的寄存器就是 RAM 类型
的,我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令,一般先将要配置的值
写入到 Rx(x=0~12) 寄存器中,然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器
中。读取 I.MX6UL 寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种: LDR
STR ,用法如表 所示:
2.1 LDR 指令
        LDR 主要用于从存储加载数据到寄存器 Rx 中,LDR 也可以将一个立即数加载到寄存器 Rx
中, LDR 加载立即数的时候要使用“ = ”,而不是“ # ”。在嵌入式开发中, LDR 最常用的就是读 取 CPU 的寄存器值,比如 I.MX6UL 有个寄存器 GPIO1_GDIR ,其地址为 0X0209C004 ,我们现在要读取这个寄存器中的数据,示例代码如下:
示例代码  LDR 指令使用
        1 LDR R0 , = 0X0209C004 @ 将寄存器地址 0X0209C004 加载到 R0 中,即 R0 = 0X0209C004
        2 LDR R1 , [ R0 ] @ 读取地址 0X0209C004 中的数据到 R1 寄存器中
        上述代码就是读取寄存器 GPIO1_GDIR 中的值,读取到的寄存器值保存在 R1 寄存器中,
上面代码中 offset 0 ,也就是没有用到 offset
2.2 STR 指令
        LDR 是从存储器读取数据, STR 就是将数据写入到存储器中,同样以 I.MX6UL 寄存GPIO1_GDIR 为例,现在我们要配置寄存器 GPIO1_GDIR 的值为 0X20000002 ,示例代码如下: 示例代码 STR 指令使用
        1 LDR R0 , = 0X0209C004 @ 将寄存器地址 0X0209C004 加载到 R0 中,即 R0 = 0X0209C004
        2 LDR R1 , = 0X20000002 @R1 保存要写入到寄存器的值,即 R1 = 0X20000002
        3 STR R1 , [ R0 ] @ R1 中的值写入到 R0 中所保存的地址中
        LDR 和 STR 都是按照字进行读取和写入的,也就是操作的 32 位数据,如果要按照字节半字进行操作的话可以在指令“LDR ”后面加上 B H ,比如按字节操作的指令就是 LDRB
STRB ,按半字操作的指令就是 LDRH STRH.
3.压栈和出栈指令
        我们通常会在 A 函数中调用 B 函数,当 B 函数执行完以后再回到 A 函数继续执行。要想 再跳回 A 函数以后代码能够接着正常运行,那就必须在跳到 B 函数之前将当前处理器状态保存 起来( 就是保存 R0~R15 这些寄存器值 ) ,当 B 函数执行完成以后再用前面保存的寄存器值恢复 R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护,恢复 R0~R15 寄存器的操作就叫做 恢复现场。在进行现场保护的时候需要进行压栈( 入栈 ) 操作,恢复现场就要进行出栈操作。压栈 的指令为 PUSH ,出栈的指令为 POP PUSH POP 是一种多存储和多加载指令,即可以一次 操作多个寄存器数据,他们利用当前的栈指针 SP 来生成地址, PUSH POP 的用法如表 所示:
      假如我们现在要将 R0~R3 R12 5 个寄存器压栈,当前的 SP 指针指向 0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
        PUSH {R0~R3, R12} @将 R0~R3 R12 压栈

        POP {LR}  @先恢复 LR
        POP {R0~R3,R12} @在恢复 R0~R3,R12
出栈的就是从栈顶,也就是 SP 当前执行的位置开始,地址依次减小来提取堆栈中的数据
到要恢复的寄存器列表中。 PUSH POP 的另外一种写法是“ STMFD SP !”和“ LDMFD SP! ”,

因此上面的汇编代码可以改为:

示例代码 7.2.3.1 STMFD 和 LDMFD 指令
1 STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
2 STMFD SP!,{LR} @LR 入栈
3
4 LDMFD SP!, {LR} @先恢复 LR
5 LDMFD SP!, {R0~R3, R12} @再恢复 R0~R3, R12
        STMFD 可以分为两部分: STM FD ,同理, LDMFD 也可以分为 LDM FD 。看到 STM
LDM 有没有觉得似曾相识 ( 不是 STM32 啊啊啊啊 ) ,前面我们讲了 LDR STR ,这两个是
数据加载和存储指令,但是每次只能读写存储器中的一个数据。 STM LDM 就是多存储和多
加载,可以连续的读写存储器中的多个连续数据。
        FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则 ,ARM 使用的 FD 类型
的堆栈, SP 指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长
的堆栈,因此最常用的指令就是 STMFD LDMFD STM LDM 的指令寄存器列表中编号
小的对应低地址,编号高的对应高地址。

 4. 跳转指令

4.1 B 指令
        这是最简单的跳转指令,B 指令会将 PC 寄存器的值设置为跳转目标地址, 一旦执行 B 指 令,ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行
处,那就可以用 B 指令,如下示例:
,那就可以用 B 指令,如下示例:
示例代码 7.2.4.1 B 指令示例
1 _start:
2
3 ldr sp,=0X80200000 @设置栈指针
4 b main @跳转到 main 函数
上述代码就是典型的在汇编中初始化 C 运行环境

 上述代码就是典型的在汇编中初始化 C 运行环境,然后跳转到 C 文件的 main 函数中运行,上述代码只是初始化了 SP 指针,有些处理器还需要做其他的初始化,比如初始化 DDR 等等。 因为跳转到 C 文件以后再也不会回到汇编了,所以在第 4 行使用了 B 指令来完成跳转。

4.2 BL 指令
        BL 指令相比 B 指令,在跳转之前会在寄存器 LR(R14) 中保存当前 PC 寄存器值,所以可以
通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行,这是子程序调用
一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的,主要用汇编
来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数,所以就会存
在汇编中调用 C 函数的问题。而且当 C 语言版本的中断处理函数执行完成以后是需要返回到
irq 汇编中断服务函数,因为还要处理其他的工作,一般是恢复现场。这个时候就不能直接使用
B 指令了,因为 B 指令一旦跳转就再也不会回来了,这个时候要使用 BL 指令,示例代码如下:
示例代码 7.2.4.2 BL 指令示例
1 push {r0, r1} @保存 r0,r1
2 cps #0x13 @进入 SVC 模式,允许其他中断再次进去
3
5 bl system_irqhandler @加载 C 语言中断处理函数到 r2 寄存器中
6
7 cps #0x12 @进入 IRQ 模式
8 pop {r0, r1} 
9 str r0, [r1, #0X10] @中断执行完成,写 EOIR
        上述代码中第 5 行就是执行 C 语言版的中断处理函数,当处理完成以后是需要返回来继续
执行下面的程序,所以使用了 BL 指令。
5.1  算术运算指令

 6.1 逻辑运算指令

        我们用 C 语言进行 CPU 寄存器配置的时候常常需要用到逻辑运算符号,比如“ & ”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令,常用的运算指令用法如表 7.2.6.1 所示

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

汇编基础知识 的相关文章

  • 招聘Bev感知实习生

    工作职责 1 负责Bev感知算法调研和运用 2 负责模型量化部署 职位要求 1 熟悉Bevformer BevFusion等深度学习网络结构 2 熟悉C Python程序开发 3 具有良好的沟通能力 良好的团队合作精神 简历投递邮箱 lei

随机推荐

  • JavaSE进阶(二)—— 面向对象进阶(包、权限修饰符、抽象类、多态)

    目录 一 包 1 什么是包 2 导包 二 权限修饰符 1 什么是权限修饰符 2 权限修饰符的分类和具体作用范围 3 学完权限修饰符需要具备如下能力 三 final 1 final的作用 2 final修饰变量的注意 四 常量 1 常量概述和
  • C语言零基础入门习题(四)分苹果

    前言 C语言是大多数小白走上程序员道路的第一步 在了解基础语法后 你就可以来尝试解决以下的题目 放心 本系列的文章都对新手非常友好 Tips 题目是英文的 但我相信你肯定能看懂 一 Mr Wang wants to give some ap
  • C++编程命名规范

    C 编程命名规范 PS 根据多年工作经验和其它命名规范整理而成 个人感觉比较规范的标准 现应用于我的开发团队 一 命名通用规则 文件名 函数名 变量名命名应具有描述性 不要过度的缩写 类型变量是名词 函数名是动词或动词 名词 函数名必须是指
  • 编译原理笔记

    目录 序章 编译原理 编译器 程序设计语言 第一章 概述 机器语言 第一代语言 特点 汇编语言 高级程序设计语言 鼻祖 时期 特点 翻译程序 汇编语言 解释语言 编译程序 编译过程 词法分析 语法分析 语义分析 中间代码生成 之前三步都是编
  • MongoDB数据库的基本操作

    一 使用async await对CRUD进行封装 1 定义dao层 数据库访问层 专门用于访问数据库 不和接口直接联系 2 定义service层 服务层 通过调用dao层的方法来获取数据 将结果通过res对象响应给客户端 3 路由接口 功能
  • odoo14本地开发部署

    odoo本地开发部署 1 使用git在本地安装odoo 1 1地址 https github com odoo odoo 1 2 复制https里面链接 git clone http github com odoo odoo git 1 2
  • maven打包,依赖也打进jar包

    一 如果没有依赖第三方包 可以用maven jar plugin插件 只是修改META INFO下的MANIFEST MF信息 指定运行jar包的main入口
  • [代码审计] fengcms1.32从详细漏洞分析到漏洞利用

    前言 这是我在此发表的第一篇代码审计的文章 仅供学习参考 首发于哈拉少安全小队微信公众号 一 Cms初识 FengCms 由地方网络工作室基于PHP MYSQL开发 是一款开源的网站内容管理系统 系统支持自由订制模型 你完全可以用FengC
  • 感知机算法(原始和对偶)——100%还原统计学习方法的python代码实现,每行都有注释,超清晰

    参考 统计学习方法 第二版 李航著 目录 一 感知机的定义 二 感知机模型 三 感知机学习策略 四 感知机学习算法 4 1感知机学习算法的原始形式 4 2 感知机学习算法的对偶形式 一 感知机的定义 假设输入空间 特征空间 是 输出空间是
  • [第五空间 2021]pklovecloud

  • VScode如何设置默认自动换行设置

    VScode安装完默认不能自动换行 文本超出显示时 需要拖动下面的滑块才能看到超出的部分 如图 看起来很不方便 自动换行 为了更方便看代码 我们可以设置自动换行显示 在菜单 查看 切换自动换行 选中 就可以自动换行了 或者直接按快捷键 AL
  • c++中的栈内存和堆内存的区别以及智能指针的使用

    栈内存和堆内存的区别 https www cnblogs com ChenZhongzhou p 5685537 html https blog csdn net qianyayun19921028 article details 8036
  • python如何实现前后端交互_笔记

    前端工程师的职责 1 UI重构 2 在正确的区域渲染出服务端的数据 毕竟 我们要构建一个大的web应用 必然不是普普通通的静态页面构成 下文将罗列前端工程师应该必备的同后端打交道的常用技能 1 服务端渲染 谈起服务端渲染 对于动态服务而言
  • 不均衡数据集采样2——BorderlineSMOTE算法(过采样)

    论文 Borderline SMOTE A New Over Sampling Method in Imbalanced Data Sets Learning https citeseerx ist psu edu viewdoc down
  • 高级JS(堆、栈、作用域、闭包、原型、this指向)

    一 变量的内存分配 基本数据类型 number string boolean undefined null symbol 引用数据类型 object array object function 基本数据类型 都是存放在栈内存中 栈内存空间大
  • 接口测试工具Postman(三)使用postman抓包捕获HTTP请求

    目录 一 捕获HTTP请求 二 代理 一 捕获HTTP请求 Postman提供了轻松查看和捕获应用程序中发送和接收的实际HTTP请求流量的工具 可以在Postman本机应用程序中使用内置代理进行抓包 1 postman内置代理 postma
  • python实现AI井字棋极大极小算法和Alpha-beta算法

    python实现AI井字棋极大极小算法和Alpha beta算法 程序设计思路 主要步骤和代码 对于两个算法流程图 运行结果 程序设计思路 大致思路 井字棋最后的结果无非就是玩家赢 电脑赢和平局三种结果 而最后的结果正对应这整棵棋盘生成树的
  • 辞职后的一些感想

    辞职了 不急着找工作 一直独立开发app 整天码UI取数据填数据 知识得不到沉淀 以前的blog都删了没什么意思 重新开始做个总结 也算个新启程吧
  • 87.el-table翻页后保存前一页所选并再次返回前一页时把数据勾选上

    1 首先给
  • 汇编基础知识

    一 汇编语法 1 GNU 汇编语法适用于所有的架构 并不是 ARM 独享的 GNU 汇编由一系列的语句组成 每行一条语句 每条语句有三个可选部分 如下 label instruction comment label 即标号 表示地址位置 有