让 GCC 优化手工组装

2024-03-05

试图让 GCC 不会每次生成加载-修改-存储操作|= or &=，我定义了以下宏：

#define bset(base, offset, mask) bmanip(set, base, offset, mask)

#define bclr(base, offset, mask) bmanip(clr, base, offset, mask)

#define bmanip(op, base, offset, mask) \
asm("pshx");\
asm("ldx " #base);\
asm("b" #op " " #offset ",x " #mask);\
asm("pulx")

而且它们工作得很好；反汇编的二进制文件是完美的。

当我按顺序使用多个时，问题就出现了：

inline void spi_init()
{
  bset(_io_ports, M6811_DDRD, 0x38);
  bset(_io_ports, M6811_PORTD, 0x20);
  bset(_io_ports, M6811_SPCR, (M6811_SPE | M6811_DWOM | M6811_MSTR));
}

这导致：

00002227 <spi_init>:
    2227:       3c              pshx
    2228:       fe 10 00        ldx     0x1000 <_io_ports>
    222b:       1c 09 38        bset    0x9,x, #0x38
    222e:       38              pulx
    222f:       3c              pshx
    2230:       fe 10 00        ldx     0x1000 <_io_ports>
    2233:       1c 08 20        bset    0x8,x, #0x20
    2236:       38              pulx
    2237:       3c              pshx
    2238:       fe 10 00        ldx     0x1000 <_io_ports>
    223b:       1c 28 70        bset    0x28,x, #0x70
    223e:       38              pulx
    223f:       39              rts

有没有办法让GCC（3.3.6-m68hc1x-20060122）自动优化冗余堆栈操作？

gcc 将始终发出您告诉它发出的汇编指令。因此，您不需要显式编写代码来加载要操作的值的寄存器，而是希望告诉 gcc 代表您执行此操作。您可以通过寄存器限制来做到这一点。

不幸的是，6811 代码生成器似乎不是 gcc 的标准部分 --- 我没有在手册中找到文档。因此，我无法向您指出文档中特定于平台的部分。但您需要阅读的通用内容在这里：http://gcc.gnu.org/onlinedocs/gcc-4.8.1/gcc/Extended-Asm.html#Extended-Asm http://gcc.gnu.org/onlinedocs/gcc-4.8.1/gcc/Extended-Asm.html#Extended-Asm

语法很奇怪，但摘要是：

asm("instructions" : outputs : inputs);

...在哪里inputs and outputs是约束列表，它告诉 gcc 将什么值放在哪里。经典的例子是：

asm("fsinx %1,%0" : "=f" (result) : "f" (angle));

f表示指定的值需要进入浮点寄存器；=表示它是一个输出；然后寄存器的名称被替换到指令中。

所以，你可能会想要这样的东西：

asm("b" #op " " #offset ",%0 " #mask : "=Z" (i) : "0" (i));

...在哪里i是包含要修改的值的变量。Z您需要查找 6811 gcc 文档 --- 它是一个约束，表示对正在生成的 asm 指令有效的寄存器。这0表示输入与输出0共享一个寄存器，用于读/写值。

因为你已经告诉 gcc 你想要什么寄存器i也就是说，它可以将这些知识集成到其寄存器分配器中，并找到成本最低的方法来获得i在您需要的地方使用最少的代码。（有时不需要额外的代码。）

gcc 内联汇编非常扭曲和奇怪，但非常强大。值得花一些时间来彻底了解约束系统，以充分利用它。

（顺便说一句，我不知道 6811 代码，但是你是否忘记将操作的结果放在某处？我希望看到一个stx来匹配ldx.)

Update:哦，我明白了什么bset现在正在做的事情——它将结果写回内存位置，对吗？这仍然是可行的，但会更痛苦一些。您需要告诉 gcc 您正在修改该内存位置，以便它知道不依赖任何缓存的值。您需要有一个带有约束的输出参数m代表该位置。检查文档。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

让 GCC 优化手工组装的相关文章

从 DX:AX 寄存器转移到单个 32 位寄存器

我在添加 16 位乘法的乘积时遇到问题我想将一年例如 2015 年乘以 365 为此我 mov dx 0 to clear the register mov ax cx cx holds the year such as 2015
ICC 中的 -O3 会扰乱内在函数，使用 -O1 或 -O2 或相应的手动汇编即可

这是后续这个问题 http stackoverflow com questions 49791664 o2 in icc messes up assembler fine with o1 in icc and all optimizatio
具有自定义值类型的 map::emplace()

我使用时遇到问题map emplace 谁能帮我找出正确的语法来使用我实际上正在尝试做同样的事情这个例子 http www cplusplus com reference map map emplace 这是我的版本 include
比“add esp, 4”更小的指令

又是我我的程序中有很多 add esp 4 我正在尝试减小它的大小是否有任何更小的指令可以替代 add esp 4 pop edx 或者您不介意破坏的任何其他整数寄存器这就是现代编译器实际上所做的 https stackoverflo
使用 ACPI 在 MS-DOS 中关闭计算机

我在基于 Pentium 的计算机上运行 MS DOS 6 22 主板支持 ACPI 并且想知道是否有一个可以用来关闭计算机的汇编语言例程或者它是否比那个更难即主板具体的基本上我想创建一个小程序来从命令行关闭计算机这是专门为此编
为什么 g++ 在编译的二进制文件中存储类名？

我注意到如果我跑strings在我编译的程序上g 输出包含它使用的各种类的名称该程序是用 O3并且没有 g or p 并且当我剥离二进制文件时类名仍然存在我想知道为什么有必要g 将此信息存储在二进制文件中出现的类名似乎都是使用虚函数
intfmt: db "%d", 10, 0 在汇编中的含义

我最近在我的一个汇编文件的顶部看到了这个并意识到我在打印整数的过程中花了很长时间使用它而没有真正意识到它最初来自哪里在我的基本汇编模板中使用或 10 0 是什么结尾的意思是 section data intfmt db d 10 0
嵌入式系统：使用汇编语言时的内存布局

根据我的理解嵌入式系统运行机器代码有多种方法可以生成此代码一种是用 C 等高级语言编写程序然后使用编译器获得这样的代码另一种方法是用汇编语言为该嵌入式系统编写指令并使用汇编器将其转换为机器代码现在我们得到了加载到系统并执行的机
x86 asm 图形设置的分辨率高于 640x480？

我刚刚开始使用汇编语言感觉像学习新东西并且遇到了一些问题到目前为止我一直在浏览的所有教程都没有回答或者太旧而无法知道 1 我尝试了一些搜索也许我只是不知道正确的关键字但我找不到用于更改屏幕分辨率等的图形模式的更新列表我发现的
为什么 LED 保持亮起而不是闪烁？

这是使用 pic16f676 中的 TIMER0 中断使 LED 闪烁的 MPASM 代码端口 A 的引脚 0 RA0 未切换至关闭位置请帮忙我是图片组装的新手我想掌握图片有没有高手帮我学习一下我需要以 1 秒的间隔眨眼代码是
将以下机器语言代码（0x2237FFF1）翻译成MIPS汇编

到目前为止我已经翻译了这段代码但我不明白的是如何计算计算 16 位立即地址的数量 0x2237FFF1 转为二进制 0010 0010 0011 0111 1111 1111 1111 0001 现在我正在读取操作码 001000 并知
测试 xmm/ymm 寄存器是否为零的更快方法？

It s fortunate that PTEST does not affect the carry flag but only sets the rather awkward ZF also affects both CF and ZF
INT 13h 无法读取超出特定扇区的数据

我正在为我的操作系统编写内核在将磁盘扇区加载到内存时遇到问题以下是从磁盘加载扇区的函数代码部分 mov ax 0x3000 mov es ax mov ax 0x0201 mov bx word ptr bp 6 bx 0x000 0x
处理器在操作码和数据之间有何不同？ [复制]

这个问题在这里已经有答案了我正在尝试编写一个反汇编程序我想知道处理器如何区分操作码和数据字节例如这是 Hello World 的字节表示 0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x
cpp 和 gcc -E 的区别

我以为两者cpp foo c and gcc E foo c以相同的方式预处理源文件但是对于同一文件我得到的输出有所不同 cat foo c define VARIABLE 3 define PASTER x y x y define
为什么我的代码在编译用于分析 (-pg) 时在多线程下运行比在单线程下运行慢？

我正在写一个光线追踪器最近我在程序中添加了线程以利用 i5 四核上的附加内核奇怪的是应用程序的调试版本现在运行速度变慢但优化后的构建运行速度比添加线程之前更快我将 g pg 标志传递给 gcc 以进行调试构建并将 O3 标志
具有重复符号的 C++ 插件库上的段错误

我有一个跨平台 C 应用程序它分为多个共享库并从插件共享库加载附加功能插件库应该是自包含的并自行运行无需了解或依赖于调用应用程序其中一个插件包含从主应用程序复制的代码因此包含与引擎中的符号名称重复的符号名称是的我知道这通常是
将代码保存在 L1 缓存中

我一直在阅读维基百科关于 K 编程语言的文章 http en wikipedia org wiki K programming language Performance characteristics这就是我所看到的解释器的小尺寸和语言的
为什么这个函数在额外读取内存时运行速度如此之快？

我目前正在尝试了解 x86 64 上某些循环的性能属性特别是我的 Intel R Core TM i3 8145U CPU 2 10GHz 处理器具体来说在循环体内添加一条额外的指令来读取内存几乎可以使性能提高一倍而细节并不是特别重
跳转目的地太远：3 个字节

我的循环有问题其中包含的代码很长并且给了我错误jump destination too far by 3 byte s 当我删除时 mov edx offset str1 call writestring 这部分位于主过程下方它不会给出

随机推荐

Apple CI / Xcode 服务和 Jenkins

有没有办法插件将新的 Xcode 服务和或新的 Apple CI 与 Jenkins 集成 Why 通过 Jenkins 服务器 OSX 构建从属连接的主要问题ssh就是它单元测试不起作用因为 iOS 模拟器需要图形环境但此配置中不
如何重命名文档目录中的文件？

我将文件保存在名为的文档目录中1 png 2 png 3 png 4 png 5 png 如果我删除原来的文件3 png 如何重命名文件4 png and 5 png被称为3 png and 4 png分别这是我首先用来编写文件的代码 N
使用裸函数签名和其他字段实现 TypeScript 接口

如何编写一个实现此 TypeScript 接口的类并使 TypeScript 编译器满意 interface MyInterface string text2 content string 我看到了这个相关的答案如何让一个类在 Type
Django - DetailView - `get_object` 函数混淆

我是 CBV 新手不知道为什么这不起作用视图 py class ItemDetailView DetailView display an individual item model Item template name boutique
如何在 LiquiBase 变更集中构建 WHERE 子句

我如何以 LiquiBase 表示法定义变更集以更新带有 AND 的 WHERE 子句的表列
实体框架 4.2 枚举支持

EF 4 2 Code First 是否支持枚举类型如果是这样你如何使用它使用 Nuget EntityFramework 包时以下内容不会为枚举属性创建字段 public class FooContext DbContext pu
如何从 FastAPI 应用程序获取每条路线路径？

我是 FastAPI 和 Python 的新手我需要获取根路径上的所有路由并将其显示给用户但是我找不到递归获取所有路径的方法 API 的版本借助以下工具进行 VersionedFastAPI并且当前代码没有给出版本内部的路径它只返回
动态地将行“透视”为列 - SQL Server

我有一个看起来像这样的表 DtCreated UserName Question Answer 2016 09 24 14 30 11 927 mauricio Senha 99658202 2016 09 24 14 30 11 927
创建或编辑模型实例时 Django admin 404 错误

我目前正在调试 Django 站点的一个奇怪问题其中一个特定模型在创建新实例或在管理界面中编辑现有实例时触发 404 错误具体来说该错误是在提交表单时发生的我可以GET变化形式就好了这种情况仅发生在实时站点上并且仅在保存此模型时发
语法写作工具[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在尝试用 EBNF 编写语法除非有很好的理由否则它必须是 EBNF 并且正在寻找一些实用程序如果有一个 GUI 界面可以制作一个
String 类型和 string 类型有什么区别？

有谁知道之间的区别String and string在打字稿中我假设它们应该相同是否正确 var a String test var b string another test a b b a this gives a compiler
用于本地主机上传和安装 WooCommerce 的 WordPress FTP 连接设置

我无法上传 WooCommerce zip 文件并在本地主机上安装插件每次我单击安装按钮时 WordPress 都会询问 FTP 凭据的连接信息如下图所示即使我输入 localhost 作为主机名输入 admin 作为用户名但它不
如何删除存储库中的文件，同时在本地保留（和忽略）它们？

我错误地将一些本地项目文件添加到 git 存储库并提交推送它们我想从远程存储库中删除这些文件将它们保留在本地并在将来的提交推送中忽略它们解决这个问题的最佳方法是什么最干净的解决方案如下 git rm cached本地的额外文件
如果使用 CreateResponse 扩展方法返回 Azure Function HttpResponseMessage，则执行测试时出错

我的Azure功能代码如下 public static class MyHttpTriggerFunction public static async Task
PHP内容分离

所以我们都知道不仅在 PHP 中您应该始终将代码与内容设计 html 分开我今天在这里看到有人说相反的我的意思是您不希望在更大的项目中使用其中之一是吗但是将代码与内容分离的好方法是什么我一直在使用一个简单的模板系统主要
Angular2 中的 ViewChildren 装饰器可以与接口一起使用吗？

我对 Angular 2 的理解是ViewChildren装饰器允许组件获取其他组件或指令的查询当我知道组件的特定类型时我可以让它在 Typescript 中工作但我希望能够获得QueryList当我刚刚知道组件的接口时这样我就可
如何提取大型文本文件中两个唯一单词之间的信息

我有大约 150 个充满字符信息的文本文件每个文件包含两个独特的单词 alpha 和 bravo 我想提取这些独特单词之间的文本并将其写入不同的文件我可以手动按 CTRL F 组合这两个单词并复制它们之间的文本我只是想知道如何使用程序
将 Postgresql 与 Grails 一起使用：缺少序列或表：hibernate_sequence

我在使用 Grails 2 0 和 Postgresql 9 1 时遇到问题我正在尝试使用顺序 ID 映射现有数据库但是即使没有在域中创建任何类我也会遇到错误 Compiling 1 source files Running Gra
如何在 Liquid Haskell 中编写 log2 函数

我正在尝试从 Liquid Haskell 学习book http ucsd progsys github io liquidhaskell tutorial book pdf 为了测试我的理解我想写一个函数log2它接受 2 n 形式的
让 GCC 优化手工组装

试图让 GCC 不会每次生成加载修改存储操作 or 我定义了以下宏 define bset base offset mask bmanip set base offset mask define bclr base offset mas

让 GCC 优化手工组装

让 GCC 优化手工组装 的相关文章

随机推荐

热门标签

让 GCC 优化手工组装的相关文章