ARM汇编语言 - 简介 [二]

2023-05-16

上文介绍了ARM的数据传送指令，本文将主要介绍ARM中的移位、序转和位操作等数据处理指令。

【移位指令】

移位包括逻辑移位和算术移位，所谓“逻辑”就是将寄存器中存放的内容仅仅视为一串bits，移位的时候只需要将这些bits直接左移(LSL - Logical Shift Left)或右移(LSR - Logical Shift Righ)即可，因为寄存器的位宽是固定的，因而有一些bits会被移出寄存器。

如果用上ROR(Rotate Right)这种循环形式的逻辑移位指令，则从LSB移出的bits又会依次进入MSB。既然LSR都有对应的LSL，那ROR是不是也有对应的ROL(Rotate Left)呢？没有，以32位系统为例，循环左移n个bits跟循环右移32-n个bits的效果其实是一样的。

而“算术”则是将寄存器中存放的内容视作一个数值，移位的时候就需要考虑数值的正负问题。在ARM中，只有算术右移(ASR - Arithmetic shift right)指令，没有算术左移指令。在算术右移中，MSB端空出的bit将被代表符号的MSB补齐，每右移一位的结果相当于除以2。

【数据序转指令】

“数据序转”是指将寄存器中的bits或bytes进行部分交换，交换的形式有很多种，包括反转所有bits的RBIT指令，反转所有bytes的REV指令，在两个16位的half word中分别反转bytes的REV16指令。

其中REV指令应该是用的最多的，因为它可以用于网络传输中Little-Endian(LE)和Big-Endian(BE)之间的转换。在ARMv8中，数据访问(data access)根据系统控制寄存器SCTLR的设定可以是LE或者BE，但取指(instruction fetch)则永远是LE。

在64位系统中，还增加了一个在两个32位的word中分别反转bytes的REV32指令：

【比特的手术刀】

像AND, ORR这样的传统的位操作指令使用频率高，浅显易懂，但如果要实现一些更为复杂的位操作，就需要一些更为专业的指令，比如将一个寄存器的部分bits插入另一个寄存器的指定部分的BFI(Bit Field Insert)指令，或者将这些bits直接提取出来的BFX(Bit Field Extract)指令，还有将指定部分的bits清零的BFC(Bit Field Clear)指令。

比如"BFI W0, W1, #9, #6"就是将W1寄存器LSB端的6个bits插入到W0寄存器从bit 9到bit 14的位置。

写到这里我想起了基因编辑，推荐大家看看王立铭老师的《上帝的手术刀》。

下文将介绍ARM中的无条件跳转指令和有条件跳转指令。

原创文章，转载请注明出处。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

arm

汇编语言

ARM汇编语言 - 简介 [二] 的相关文章

从 Visual Studio 交叉编译 ARM7 代码

是否可以从 Visual Studio 2008 2010 Express 或 Professional 编译 ARM7 如果是这样可以指导我如何做吗我读过有关 Yagarto 工具链的其他帖子这一切是如何融入图片中的我在这个领域非
对 -finstrument-functions 的未定义引用

我正在尝试跟踪内核函数并且我正在使用 finstrument functions这样做但我收到未定义的参考错误如下所示 arch arm kernel elf c 9 undefined reference to cyg profile
armv8 NEON if 条件

我想了解armv8 NEON内联汇编代码中的if条件在armv7中这可以通过检查溢出位来实现如下所示 VMRS r4 FPSCR BIC r4 r4 1 lt lt 27 VMSR FPSCR r4 vtst 16 d30 d30 d
我们可以优化代码来降低功耗吗？

有没有什么技术可以优化代码以确保更低的功耗架构是ARM 语言是C 来自 ARM 技术参考网站 ARM11 MPCore 的特性提高能源效率的处理器效率包括准确的分支和子程序返回预测减少数量错误的指令获取和解码操作使用物理寻址
通用 ELF 中的重定位（EM：40）

我尝试从 Ubuntu 交叉编译到Friendly arm 但出现了奇怪的错误 root kevin VirtualBox home kevin Desktop makef make ARCH arm CROSS COMPILE arm n
如何创建具有自定义外设和内存映射的 QEMU ARM 机器？

我正在为 Cortex M3 cpu 编写代码并且正在使用以下命令执行单元测试qemu arm二进制现在一切都很好但我想知道我是否能够使用测试整个系统qemu system arm 我的意思是我想为 qemu 编写自定义机器我将
ARM 汇编不能同时使用立即值和 ADDS/ADCS

我目前正在尝试使用汇编来加速 Cortex M0 Freescale KL25Z 上的一些 C 函数我遇到这个最小测试程序的问题 syntax unified cpu cortex m0 text global test code 16
将 ZeroMQ 交叉编译为 ARM，以便在 MonoTouch iPhone 应用程序配置设置中使用

我正在尝试在使用 MonoTouch 用 C 开发的 iPhone 应用程序中使用 ZeroMQ 库我几乎解决了所有的问题却在最后一道坎倒下了我正在使用 ZeroMQ 2 1 10 和 C CLR 绑定包装器并在 Mac OS X
如何在 ARM 架构上从 RAM 运行代码

我正在对 ARM Cortex R4 进行编程并且有一些二进制文件我想从 TCRAM 执行它们只是为了看看性能的提升是否足够好我知道我必须编写一个函数来将二进制文件复制到 RAM 这可以通过链接器脚本来完成并且知道二进制文件的大小
ARM 的启动过程是怎样的？

我们知道对于X86架构按下电源按钮后机器开始执行0xFFFFFFF0处的代码然后开始执行BIOS中的代码以进行硬件初始化 BIOS 执行后它使用引导加载程序将操作系统映像加载到内存中最后操作系统代码开始运行对于ARM架构使
如何修改内核DTB文件

Summary 我目前正在为定制板编译 Linux 内核内核模块和 DTB 以及一些定制驱动程序有时我会编译内核并意识到 DTB 文件中的兼容性字符串不是自定义驱动程序正在寻找的内容现在我可以解决此问题的唯一方法是修改 DTS
将结构体偏移属性赋予汇编器

如何将 C 结构体的偏移量发送到汇编代码例如在我的 C 代码中 typedef struct unsigned int a unsigned int b CMyStruct 我向 ASM 函数发送一个 CMyStruct 结构的指针假
ARM架构中不同处理器模式下如何使用内核堆栈？

据我了解每个进程都有一个用户堆栈和内核堆栈除此之外 ARM 架构中的每种模式都有一个堆栈所以我想知道不同的堆栈和堆栈指针在 ARM 模式下如何工作另外何时会使用与进程关联的内核堆栈何时会使用与进程关联的内核堆栈当您进行系统调用
如何使用 gcc 编译代码和 ARM Cortex A8 目标进行调用图分析？

我对这个已经咬牙切齿了我需要在 ARM 板上进行分析并需要查看调用图我尝试使用 OProfile Kernel perf 和 Google 性能工具一切正常但不输出任何调用图信息这使我得出结论我没有正确编译代码我在编译 C 代
DSP 库 - RFFT - 奇怪的结果

最近我一直在尝试在我的STM32F4 Discovery评估板上进行FFT计算然后将其发送到PC 我已经调查了我的问题我认为我对制造商提供的 FFT 函数做错了我正在使用 CMSIS DSP 库现在我一直在用代码生成样本如果工作正
GCC ARM 汇编预处理器宏

我正在尝试使用汇编 ARM 宏进行定点乘法 define MULT a b asm volatile SMULL r2 r3 0 1 n t ADD r2 r2 0x8000 n t ADC r3 r3 0 n t MOV 0 r2 ASR
交叉编译 Qt 4.7 时出现“非法指令”

我已经在这个问题上苦苦挣扎了一个多星期了但仍然找不到解决方案我正在尝试为 ARM 设备交叉编译 Qt 4 7 嵌入式开源版本构建过程本身可以顺利完成但生成的二进制文件似乎包含处理器无法理解的指令构建主机是 i386 上的 Debi
为什么当大小大于 50 时，该程序花费的时间会呈指数级增长？

所以我正在为类编写一个 ARM 汇编快速排序方法我对大部分内容都有了解除了复杂性没有意义我们将其与我们制作的另一种冒泡排序方法进行比较它对于具有 1 个参数和 10 个参数的示例表现更好然而我什至无法比较 100 个参数测试因
使用 NEON 优化 Cortex-A8 颜色转换

我目前正在执行颜色转换例程以便从 YUY2 转换为 NV12 我有一个相当快的函数但没有我预期的那么快主要是由于缓存未命中 void convert hd uint8 t orig uint8 t result uint32 t wi
AOSP 的“午餐”组合是什么意思？我需要选择什么？

我是 Android 设备 ROM 开发的新手无论如何我现在正在为具有 64 位处理器的中国设备构建 AOSP 我按照 source android com 上的菜单进行操作当我运行午餐命令时终端显示午餐菜单选择一个组合我

随机推荐

C++ 设计模式23：访问者模式

C 23种设计模式系列文章目录创建型模式第1式工厂方法模式第2式抽象工厂模式第3式单例模式第4式建造者模式第5式原型模式结构型模式第6式适配器模式第7式桥接模式第8式组合模式第9式装饰器模式
C++设计模式17：中介者模式

C 23种设计模式系列文章目录创建型模式第1式工厂方法模式第2式抽象工厂模式第3式单例模式第4式建造者模式第5式原型模式结构型模式第6式适配器模式第7式桥接模式第8式组合模式第9式装饰器模式
C++设计模式14：命令模式

C 23种设计模式系列文章目录创建型模式第1式工厂方法模式第2式抽象工厂模式第3式单例模式第4式建造者模式第5式原型模式结构型模式第6式适配器模式第7式桥接模式第8式组合模式第9式装饰器模式
GPS 和 RTK 定位

refers xff1a https blog csdn net u012241570 article details 80802675 GPS定位的基本原理测量出已知位置的卫星到地面GPS接收器之间的距离 xff0c 然后接收器通过与至
关于GD32的CMakeLists以及gcc部分编译选项的解释

set CMAKE SYSTEM NAME Generic cmake最低版本 cmake minimum required VERSION 3 0 0 工程名称语言 project TEST PRJ NAME LANGUAGES C C
ulimit -s 指定栈上的内存上限

转自 xff1a http blog chinaunix net uid 24439730 id 144094 html ulimit s 指定栈上的内存上限 xff0c 单位为KB xff0c 如 xff1a root 64 wdqf1w
C++头文件重复包含问题

为了避免同一个文件被include多次有两种方式 1 span class token macro property span class token directive keyword ifdef span SOMEFILE H spa
TCP（select函数模型）

客户端代码 include lt stdio h gt include lt sys types h gt include lt sys socket h gt include lt arpa inet h gt include lt st
i2c那些坑

origin http bbs ntpcb com simple t126695 html I2C 的那些坑一般情况下 xff0c i2c 设备焊接没什么问题 xff0c 按照设备手册一步步来 xff0c 基本上就顺风顺水能够用起来如果
stm32f103系列引脚定义-功能图

器件功能和配置 STM32F103xx增强型 STM32F103xx增强型模块框架图 STM32F103xx增强型VFQFPN36管脚图 STM32F103xx增强型LQFP100管脚图 STM32F103xx增强型LQFP64管脚图 ST
用数百行代码实现60亿设备互联：微软重金收购的ThreadX硬在何处

origin https www sohu com a 315222502 485057 2019年4月 xff0c 微软收购了ThreadX的母公司Express Logic 公司而ThreadX有几亿个设备在运行 1 物联网操作系统简
Cache和DMA一致性

cache读必须要buffer是cacheline对齐的 DMA应该多多少少知道点吧 DMA Direct Memory Access 是指在外接可以不用CPU干预 xff0c 直接把数据传输到内存的技术这个过程中可以把CPU解放出来 x
stm32几种低功耗模式的实现和差别

origin https blog csdn net jian3214 article details 99818603 01 前言按功耗由高到低排列 xff0c STM32具有运行睡眠停止和待机四种工作模式上电复位后 STM32
threadx也开源了

前一段时间ucos开源了 xff0c 今天微软收购的threadx也开源了 xff0c 行业剧变呀 xff01 xff01 xff01 2020 5 26
armv8-M 32bit处理器

https www eet china com mp a14579 html https developer arm com ip products processors cortex m 最早的Cortex M0属于Armv6 M架构 x
作为ARM Cortex-M家族的继承者 Cortex-M23与M33有哪五大特色？

http news eeworld com cn xfdz article 2017011259937 html 集微网消息 xff0c ARM处理器在嵌入式设备领域的应用非常广泛基于ARM Cortex处理器的片上系统 xff08 So
emmc5.1, ufs2.0, ufs3.0

总的来说 xff0c UFS3 0的综合性能 xff0c 特别是持续读写速度有着秒杀UFS2 1前辈的表现 xff0c 只是在随机读写和SQLite性能上 xff0c 却依旧和双通道的UFS2 1持平 xff0c 有些小遗憾最后 xff0
串行Norflash是如何实现XIP的？

先说问题 xff1a 要想程序在串行的Norflash中运行 xff0c 到底需要做哪些工作 xff1f Norflash和Nandflash想必大家都知道恕本人才学疏浅 xff0c 最近突然发现Norflash可以并行连接实现XIP x
ARM汇编语言 - 简介 [一]

origin https zhuanlan zhihu com p 82490125 ARM汇编语言简介一兰新宇 talk is cheap 说明 xff1a 本系列文章将主要以ARMv7和ARMv8架构为例 xff0c 介绍ARM汇
ARM汇编语言 - 简介 [二]

上文介绍了ARM的数据传送指令 xff0c 本文将主要介绍ARM中的移位序转和位操作等数据处理指令移位指令移位包括逻辑移位和算术移位 xff0c 所谓逻辑就是将寄存器中存放的内容仅仅视为一串bits xff0c 移位的时候只需要将

ARM汇编语言 - 简介 [二]

ARM汇编语言 - 简介 [二] 的相关文章

随机推荐

热门标签