ARM汇编语言 - 简介 [三]

2023-05-16

上文介绍了ARM的数据处理指令，本文将主要介绍ARM中的跳转指令。

【跳转指令】

无条件跳转

ARM中的基础跳转指令就一个字母"B"，代表Branch，相比起x86中和它功能基本相同的"jmp"指令，意思显得稍微隐晦了点。"B"属于无条件跳转，就是不管三七二十一，跳就对了，如果跳转的目标地址不是由立即数直接给出，而是通过寄存器给出，那就应该使用"BX"。

B        label       ;jump to the address given by the label   
BX       reg         ;jump to the address given by the register

目标地址是否由寄存器给出只是表象，真正的区别在于，由于"B label"这条指令整个是占4个bytes，也就是32个bits，而这32个bit不可能全给"label"这个操作数用，所以如果用"label"表示绝对地址的话，是无法寻址整个32位地址空间的。这也不碍事，把"B label"作为相对跳转指令好了，"label"在这里就是基于当前PC的相对地址。（如果想查看像下图这样的某个指令的编码格式，可以上这个网站）。

无条件指令没有"Cond"部分，所以留给"label"用的有28个bits，由于相对跳转可以是朝前或者朝后，所以还需要留一个bit表示方向，因此ARMv8中"B label"的跳转范围是前后128MiB(ARMv7是前后32MiB)。

"BX"就没有这个烦恼，因为寄存器的位宽是32位/64位，直接用寄存器给出的绝对地址就可以跳转到任何一个地址单元。前文讲过，ARMv8将通用寄存器的名称由"R"改成了"X"，神奇的是，ARMv7中"BX"在ARMv8中居然变成了"BR"，整个反过来了。

有的时候，"B"后面还会跟上一个"L"，"L"代表记录函数返回地址的link register(R14/X30)，暗示接下来的跳转其实是一个子函数调用，类似于x86中的"call"指令。

有条件跳转

更多的时候，跳转是结合着一定的条件进行的，对应我们的高级语言就是"if", "else"这样的。比如"BEQ"就是相等(equal)的时候才跳，而是否相等则是由前序的指令，比如比较指令"CMP"执行后的结果(Zero)决定的。

BEQ后面跟的地址也是相对地址，而且这个地址范围不再是前后128MiB，而是前后1MiB。汇编指令的数目越少，形成的二进制镜像所占的代码段空间就越小，执行效率也可能更高。

为此，还有一些二合一的指令，相当于把两条有相关性的指令压缩在了一起，比如"CBZ"就等同于"CMP"加上"BEQ"，这也是前文提到的"RISC和CISC之间相互融合"的一个例证，毕竟，占用代码空间小，执行效率高的优点谁不想要呢。

虽然普通的条件跳转指令就可以表达"if", "else"这样的分支语句，但如果分支嵌套层次较多，直接使用条件跳转指令就显得不够高效了。为此，ARMv7专门推出了长的和高级语言的关键字很像的"IF‐THEN(IT)"，这已经不是一条单独的指令了，而是一个指令块(IT blocks)。它的格式是这样的：

IT <x> <y> <z>    <cond>

<x>,<y>,<z>的总数从0到3个不等，其取值可以是"T"或者"E"(顺序没有要求)，其中"T"(Then)对应条件(cond)成立时执行的语句，"E"(Else)对应条件不成立时执行的语句。比如这样一段C语言代码：

if (R0==R1)   {  R3 = R4 + R5;    R3 = R3 / 2; }  
else          {  R3 = R6 + R7;    R3 = R3 / 2; }

使用IT指令块汇编的结果是这样的：

CMP    R0, R1        ; compare R0 and R1 
ITTEEEQ              ; if R0 == R1, Then-Then-Else-Else 
ADDEQ  R3, R4, R5    ; R3 = R4 + R5
ASREQ  R3, R3, #1    ; R3 = R3 / 2
ADDNE  R3, R6, R7    ; R3 = R6 + R7
ASRNE  R3, R3, #1    ; R3 = R3 / 2

是不是非常紧凑，代码行数跟其对应的高级语言都不相上下。这种指令对软件来说是相当友好的，但鱼和熊掌不可兼得，为软件层面提供更大的便利通常意味着需要在硬件层面做更多更复杂的工作，而且可能造成效率的损失。这也不难理解，像python这种语言开发更快捷，但执行效率就比不上C语言。所以啊，ARM的工程师权衡利弊，最终在ARMv8中移除了这个指令块。

替代方案是使用一组新的指令，包括CSEL(Conditional Select), CINC(Conditional Increase)和CSET(Conditional Set)等，以CSEL为例，它的用法是这样的：

CSEL <Xd>, <Xn>, <Xm>, <cond>

意思是如果条件(cond)满足，就选择(sel)Xn作为Xd，否则选择Xm作为Xd。比如下面这条语句：

CSEL X0, X0, X1, ge

表示的是如果X0>=X1(ge - greater or equal)，那么X0=X0(保持不变)，否则X0=X1。虽然比IT指令块的语法看起来要直观一些，但比起IT指令块能表达的层级关系，还是稍微弱了一点。

参考：

https://azeria-labs.com/arm-conditional-execution-and-branching-part-6/

原创文章，转载请注明出处。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

arm

汇编语言

ARM汇编语言 - 简介 [三] 的相关文章

对 -finstrument-functions 的未定义引用

我正在尝试跟踪内核函数并且我正在使用 finstrument functions这样做但我收到未定义的参考错误如下所示 arch arm kernel elf c 9 undefined reference to cyg profile
armv8 NEON if 条件

我想了解armv8 NEON内联汇编代码中的if条件在armv7中这可以通过检查溢出位来实现如下所示 VMRS r4 FPSCR BIC r4 r4 1 lt lt 27 VMSR FPSCR r4 vtst 16 d30 d30 d
ARM NEON：如何实现 256 字节查找表

我正在使用内联汇编将我编写的一些代码移植到 NEON 我需要的一件事是将范围 0 128 的字节值转换为表中采用完整范围 0 255 的其他字节值该表很短但其背后的数学并不容易因此我认为不值得每次即时计算它所以我想尝试查找表我
ARM 汇编不能同时使用立即值和 ADDS/ADCS

我目前正在尝试使用汇编来加速 Cortex M0 Freescale KL25Z 上的一些 C 函数我遇到这个最小测试程序的问题 syntax unified cpu cortex m0 text global test code 16
Android 上原生的自修改代码

我正在尝试在 Android 上制作一些自修改本机代码并在模拟器中运行它我的示例基于 android ndk 中的 Hello JNI 示例它看起来像这样 define NOPE LENGTH 4 typedef void FUNC v
将ELF文件加载到内存中

我正在尝试将 elf 文件放入内存然后执行它步骤如下 1 要放入内存的文件 int main printf Hello world n return 0 2 编译它gcc o hello hello c static ELF Header
适用于arm(cortex-m3)的位置独立可执行文件(-pie)

我正在使用codesourcery g lite 基于gcc4 7 2版本为stm32 Cortex m3 编程我希望动态加载可执行文件我知道我有两个选择 1 可重定位的elf 需要一个elf解析器 2 具有全局偏移寄存器的位置无关代
使用 ARM NEON 内在函数添加 alpha 和排列

我正在开发一个 iOS 应用程序需要相当快地将图像从 RGB gt BGRA 转换如果可能的话我想使用 NEON 内在函数有没有比简单分配组件更快的方法 void neonPermuteRGBtoBGRA unsigned char
在 ARM 处理器上执行存储在外部 SPI 闪存中的程序

我有一个 ARM 处理器能够与外部闪存芯片连接写入芯片的是为 ARM 架构编译的程序可供执行我需要知道如何将这些数据从外部闪存获取到 ARM 处理器上以供执行我可以提前运行某种复制例程将数据复制到可执行内存空间吗我想我可以但
手臂“版本”之间的差异？（仅限 ARMv7）

基本上我想知道ARMv7l和ARMv7之间的区别hl 我有一个带有armv7l的arm处理器并且有很多armv7的rpmhl 我完全不知道我必须搜索什么才能获得相关信息这个后缀叫什么还有其他类型吗他们的做法有何不同我假设它指示
ARM架构中不同处理器模式下如何使用内核堆栈？

据我了解每个进程都有一个用户堆栈和内核堆栈除此之外 ARM 架构中的每种模式都有一个堆栈所以我想知道不同的堆栈和堆栈指针在 ARM 模式下如何工作另外何时会使用与进程关联的内核堆栈何时会使用与进程关联的内核堆栈当您进行系统调用
DSP 库 - RFFT - 奇怪的结果

最近我一直在尝试在我的STM32F4 Discovery评估板上进行FFT计算然后将其发送到PC 我已经调查了我的问题我认为我对制造商提供的 FFT 函数做错了我正在使用 CMSIS DSP 库现在我一直在用代码生成样本如果工作正
ARM Cortex A8 PMNC 读取在启用后也给出 0.. 有什么想法/建议吗？

MODULE LICENSE GPL MODULE DESCRIPTION user mode access to performance registers int init arm init void unsigned int valu
源和目标具有不同的 EABI 版本

我正在尝试使用 ARM 工具链编译 so 文件但是我不断收到这个错误错误源对象的 EABI 版本为 0 但目标对象的 EABI 版本为 5 我无法更改工具链中的任何内容因为我必须使用给定的工具链我以前从未见过这个错误我使用了这个
尝试使用 qemu-arm 运行arm二进制文件时如何解决“加载共享库时出错”？

我正在运行 Linux Mint 14 并安装了 qemu qemu user 和 gnueabi 工具链我编译了 test carm linux gnueabi gcc test c o test 当我尝试跑步时qemu arm usr
ARM 调用约定是否允许函数不将 LR 存储到堆栈中？

正如标题所示我在理解 ARM 架构的调用约定时遇到问题特别是我仍然很难知道当你调用子程序时 LR 寄存器会发生什么我认为当您进入子程序时处理 LR 寄存器的最明显最安全的方法是将其存储到堆栈中但该行为没有出现在文档中因此我
在linux x86平台上学习ARM所需的工具[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 x86 linux 机器在阅读一些关于 ARM 的各种信息时我很好奇现在我想花一些时间学
是否可以将 SpaCy 安装到 Raspberry Pi 4 Raspbian Buster

我一整天都在安装 SpaCy sudo pip install U spacy Looking in indexes https pypi org simple https www piwheels org simple Collectin
为什么当大小大于 50 时，该程序花费的时间会呈指数级增长？

所以我正在为类编写一个 ARM 汇编快速排序方法我对大部分内容都有了解除了复杂性没有意义我们将其与我们制作的另一种冒泡排序方法进行比较它对于具有 1 个参数和 10 个参数的示例表现更好然而我什至无法比较 100 个参数测试因
使用 NEON 优化 Cortex-A8 颜色转换

我目前正在执行颜色转换例程以便从 YUY2 转换为 NV12 我有一个相当快的函数但没有我预期的那么快主要是由于缓存未命中 void convert hd uint8 t orig uint8 t result uint32 t wi

随机推荐

C++设计模式14：命令模式

C 23种设计模式系列文章目录创建型模式第1式工厂方法模式第2式抽象工厂模式第3式单例模式第4式建造者模式第5式原型模式结构型模式第6式适配器模式第7式桥接模式第8式组合模式第9式装饰器模式
GPS 和 RTK 定位

refers xff1a https blog csdn net u012241570 article details 80802675 GPS定位的基本原理测量出已知位置的卫星到地面GPS接收器之间的距离 xff0c 然后接收器通过与至
关于GD32的CMakeLists以及gcc部分编译选项的解释

set CMAKE SYSTEM NAME Generic cmake最低版本 cmake minimum required VERSION 3 0 0 工程名称语言 project TEST PRJ NAME LANGUAGES C C
ulimit -s 指定栈上的内存上限

转自 xff1a http blog chinaunix net uid 24439730 id 144094 html ulimit s 指定栈上的内存上限 xff0c 单位为KB xff0c 如 xff1a root 64 wdqf1w
C++头文件重复包含问题

为了避免同一个文件被include多次有两种方式 1 span class token macro property span class token directive keyword ifdef span SOMEFILE H spa
TCP（select函数模型）

客户端代码 include lt stdio h gt include lt sys types h gt include lt sys socket h gt include lt arpa inet h gt include lt st
i2c那些坑

origin http bbs ntpcb com simple t126695 html I2C 的那些坑一般情况下 xff0c i2c 设备焊接没什么问题 xff0c 按照设备手册一步步来 xff0c 基本上就顺风顺水能够用起来如果
stm32f103系列引脚定义-功能图

器件功能和配置 STM32F103xx增强型 STM32F103xx增强型模块框架图 STM32F103xx增强型VFQFPN36管脚图 STM32F103xx增强型LQFP100管脚图 STM32F103xx增强型LQFP64管脚图 ST
用数百行代码实现60亿设备互联：微软重金收购的ThreadX硬在何处

origin https www sohu com a 315222502 485057 2019年4月 xff0c 微软收购了ThreadX的母公司Express Logic 公司而ThreadX有几亿个设备在运行 1 物联网操作系统简
Cache和DMA一致性

cache读必须要buffer是cacheline对齐的 DMA应该多多少少知道点吧 DMA Direct Memory Access 是指在外接可以不用CPU干预 xff0c 直接把数据传输到内存的技术这个过程中可以把CPU解放出来 x
stm32几种低功耗模式的实现和差别

origin https blog csdn net jian3214 article details 99818603 01 前言按功耗由高到低排列 xff0c STM32具有运行睡眠停止和待机四种工作模式上电复位后 STM32
threadx也开源了

前一段时间ucos开源了 xff0c 今天微软收购的threadx也开源了 xff0c 行业剧变呀 xff01 xff01 xff01 2020 5 26
armv8-M 32bit处理器

https www eet china com mp a14579 html https developer arm com ip products processors cortex m 最早的Cortex M0属于Armv6 M架构 x
作为ARM Cortex-M家族的继承者 Cortex-M23与M33有哪五大特色？

http news eeworld com cn xfdz article 2017011259937 html 集微网消息 xff0c ARM处理器在嵌入式设备领域的应用非常广泛基于ARM Cortex处理器的片上系统 xff08 So
emmc5.1, ufs2.0, ufs3.0

总的来说 xff0c UFS3 0的综合性能 xff0c 特别是持续读写速度有着秒杀UFS2 1前辈的表现 xff0c 只是在随机读写和SQLite性能上 xff0c 却依旧和双通道的UFS2 1持平 xff0c 有些小遗憾最后 xff0
串行Norflash是如何实现XIP的？

先说问题 xff1a 要想程序在串行的Norflash中运行 xff0c 到底需要做哪些工作 xff1f Norflash和Nandflash想必大家都知道恕本人才学疏浅 xff0c 最近突然发现Norflash可以并行连接实现XIP x
ARM汇编语言 - 简介 [一]

origin https zhuanlan zhihu com p 82490125 ARM汇编语言简介一兰新宇 talk is cheap 说明 xff1a 本系列文章将主要以ARMv7和ARMv8架构为例 xff0c 介绍ARM汇
ARM汇编语言 - 简介 [二]

上文介绍了ARM的数据传送指令 xff0c 本文将主要介绍ARM中的移位序转和位操作等数据处理指令移位指令移位包括逻辑移位和算术移位 xff0c 所谓逻辑就是将寄存器中存放的内容仅仅视为一串bits xff0c 移位的时候只需要将
智能小车开发的重点之一电机该如何选型

一智能小车的分类二电机的分类无刷电机要好于有刷电机 xff0c 优点 xff1a 1 没有损耗 xff0c 有刷电机有寿命 2 静音 xff0c 有刷电机噪音比较大无刷电机分为带霍尔传感器和不带霍尔传感器两种 xff0c 因为无刷
ARM汇编语言 - 简介 [三]

上文介绍了ARM的数据处理指令 xff0c 本文将主要介绍ARM中的跳转指令跳转指令无条件跳转 ARM中的基础跳转指令就一个字母 34 B 34 xff0c 代表Branch xff0c 相比起x86中和它功能基本相同的 34 jmp

ARM汇编语言 - 简介 [三]

ARM汇编语言 - 简介 [三] 的相关文章

随机推荐

热门标签