为什么 ARM 使用两条指令来屏蔽一个值？

2024-03-25

对于以下功能...

uint16_t swap(const uint16_t value)
{
    return value << 8 | value >> 8;
}

...为什么带 -O2 的 ARM gcc 6.3.0 会产生以下程序集？

swap(unsigned short):
  lsr r3, r0, #8
  orr r0, r3, r0, lsl #8
  lsl r0, r0, #16         # shift left
  lsr r0, r0, #16         # shift right
  bx lr

编译器似乎使用两次移位来屏蔽不需要的字节，而不是使用逻辑 AND。编译器可以改为使用and r0, r0, #4294901760?

较旧的 ARM 程序集无法轻松创建常量。相反，它们被加载到文字池中，然后通过内存加载读入。这and你建议只能采用我相信带有移位的 8 位文字。你的0xFFFF0000需要 16 位来执行 1 条指令。

所以，我们可以从内存中加载并执行and（慢的），采用 2 条指令来创建值，并采用 1 条指令来创建值（更长），或者只是便宜地转移两次并称之为好的。

编译器选择了移位，老实说，它非常快。

现在进行现实检查：

担心一个班次，除非这确实是 100% 的瓶颈，否则就是浪费时间。即使编译器不是最优的，您也几乎永远不会感觉到。担心代码中的“热”循环，而不是像这样的微操作。出于好奇心来看这个真是太棒了。不必太担心应用程序性能的确切代码。

Edit:

这里的其他人已经指出，新版本的 ARM 规范允许更有效地完成此类事情。这表明，在这个级别进行讨论时，指定芯片或至少指定我们正在处理的确切 ARM 规范非常重要。我假设古老的 ARM 缺乏从你的输出中给出的“更新”指令。如果我们正在跟踪编译器错误，那么这个假设可能不成立，并且了解规范更为重要。对于这样的交换，在以后的版本中确实有更简单的指令来处理这个问题。

Edit 2

为了使其更快，可以做的一件事就是使其内联。在这种情况下，编译器可以将这些操作与其他工作交织在一起。根据 CPU 的不同，这可能会使吞吐量加倍，因为许多 ARM CPU 都有 2 个整数指令管道。将说明充分展开，以免出现危险，然后它就消失了。这必须与 I-Cache 使用情况进行权衡，但在重要的情况下，您可以看到更好的东西。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 ARM 使用两条指令来屏蔽一个值？的相关文章

如何使用 ASP.NET MVC 进行 HTTP 调用？

我正在尝试做的事情我试图练习进行 HTTP 调用如果这就是它的名字来自一个简单的 ASP NET MVC Web 应用程序为此我尝试从以下位置获取天气详细信息打开天气地图 http openweathermap org appid
OpenCV Visual Studio ntdll.dll

我尝试在 Visual Studio 2013 上使用 OpenCV 2 4 10 创建一个项目但由于以下异常到目前为止我运气不佳请建议帮助 TIA letstryitonemoretime exe Win32 Loaded C Us
隐式方法组转换陷阱

我想知道为什么给定代码的输出在 LinqPad 中执行 void Main Compare1 Action Main Dump Compare2 Main Dump bool Compare1 Delegate x return x Ac
C++ 中的单例和抽象基类

最近我遇到了关于实现 Singleton 但涉及抽象基类的问题假设我们有这样的类层次结构 class IFoo it s ABC class Foo public IFoo 我们的单例类定义如下 template
使用静态类型代替变量

当您的项目不使用命名空间时有什么方法可以告诉编译器使用静态类型而不是变量吗例如我有一个名为 User 的类它具有各种静态和非静态方法假设调用了其中一个静态方法GetUser 我想称之为User GetUser 方法来自一个方法该
使用 Selenium for C# 登录 Facebook

我一直在使用 Selenium C 框架并尝试进行 facebook 登录但没有任何运气这是我到目前为止得到的基于这篇文章使用 Selenium 测试 Facebook Connect 应用程序 https stackoverflo
异步方法中的异常未被捕获

下面的代码没有捕获我的OperationCancelEException 它是通过调用抛出的ct ThrowIfCancellationRequested public partial class TitleWindow Window IA
有没有办法使 C90 标准中的枚举无符号？（符合 MISRA-C 2004 标准）

我正在尝试找到一种使枚举无符号的方法 enum x1 0 x2 x3 uint8 t x2 lt PC LINT MISRA C 2004 will complain about mixing signed and unsigned h
返回指向 std::vector 中的对象的 a

我有一个关于返回对向量元素的引用的非常基本的问题有一个向量vec存储类的实例Foo 我想访问这个向量中的一个元素不想使用向量索引我应该如何编码该方法getFoo here include
async wait 在调用异步方法时返回 Task> 而不是 List

我正在尝试了解 async wait 的用法并且研究了一些博客文章现在我已经编写了一个测试代码但它没有按照我期望的方式工作我有一个返回列表的方法 private List
Azure 2012 年 10 月 SDK 损坏 UseDevelopmentStorage=true

有人尝试过使用 usedevelopmentstorage true 连接字符串的 2012 年 10 月 Azure sdk 吗 CloudStorageAccount Parse UseDevelopmentStorage true 抛
在 ncurses 中使用退格键

我设置了一个简单的 ncurses 程序它使用 getch 一次读取一个字符并将它们复制到缓冲区中我遇到的问题是检测到按下退格键这是相关代码 while buffer i c getch EOF i if c n break else
在不使用 Thread.Sleep c# 的情况下延迟发送电子邮件

我有一个 for 循环它循环并每个循环发送一封电子邮件现在我正在使用 thread sleep 但我希望用户仍然能够与程序交互只需取消该循环即可是否可以在不使用 thread sleep 的情况下做到这一点您是否在 UI 线程上运
简单的文档管理系统和API [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
std::string 在 Visual Studio 上的具体行为？

我有一个项目需要读取写入大文件我决定使用 ifstream read 将这些文件一次性放入内存中放入 std string 中这似乎是在 C 中执行此操作的最快方法 http insanecoding blogspot com 20
如何使用 libpq 获取双精度值？

The examples http www postgresql org docs 9 3 interactive libpq example htmllibpq 文档中展示了如何通过将整数值转换为主机字节序表示来获取整数值我很好奇必须做
C 中的 N 依赖注入 - 比链接器定义的数组更好的方法？

Given a 库模块在下文中称为Runner 它作为可重复使用的组件无需重新编译即静态链接库中应用程序分区架构的而不是主分区请注意它仅包含main 出于演示目的 Given a set 顺序无关调用的其他模块对象Call
使用 roslyn 扩展 C# 语法

我试图在没有 else 情况的情况下实现 return if return value if 因为我只想在条件有效时返回或返回一个值我知道有if condition return or if condition return value
实体框架代理创建

我们可以通过使用来停止在上下文构造函数中创建代理 this Configuration ProxyCreationEnabled false 在 EF 4 1 中创建代理有哪些优点和缺点代理对于两个功能是必需的延迟加载导航属性在第一次
C/C++ 通过 Android NDK 在 JNI 中看不到 Java 方法

我正在尝试从使用 NDK 构建的 C 类文件调用 Java 方法它不断抛出常见的未找到非静态方法错误并导致整个 Android 应用程序崩溃下面的代码片段有些东西可能不需要但我按原样保留它们因为焦点问题在于refreshJN

随机推荐

添加 servlet 以在 Intershop 7.4 应用程序服务器上下文中运行

我正在尝试包含一个第三方 servlet 以在我们的 IS7 应用程序服务器的上下文中运行我将如何添加 servlet 并映射到 web xml 在知识库中我只找到了有关 Enfinity Suite 6 的信息所提供的步骤似乎都不起
如何使用 SQL Server 与本周进行比较？

如何将 SQL Server 日期列与本周进行比较例如 WHERE Order SubmittedDate THIS WEEK 您可以将日期转换为周数并将其与当前日期的周数进行比较同样您还需要比较年份这样您就不会得到去年的几周 W
SQL Server 获取序列的多个下一个值

在 SQL Server 中您可以从如下序列中选择下一个值 select next value for MY SEQ 如果您不抑制要从中选择的表则对于每一行将输出下一个值 select next value for MY SEQ fr
virtualenv 上的 pip install requests[security] 无法构建密码学和 cffi 轮子

跟随时this http docs python guide org en latest dev virtualenvs and this https www jeffknupp com blog 2012 02 09 starting a
JavaScript 设计模式[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案这是一个一般性讨论的问题是否有任何关于有用的 JavaScript 设计模式的优质全面的资源我试图避免引用那些试图通过强加更适合
为什么 Razor 找不到我的 HTML 帮助程序？

我正在尝试将经典 ASP NET MVC 视图移植到 Razor 但在尝试使用传统非 Razor Html 帮助器方法时遇到了困难辅助方法具有以下签名 public static string WrappedValidationSum
cudaGetDevice() 失败。状态：CUDA 驱动程序版本不足以满足 CUDA 运行时版本

当我在 GPU 中运行 TensorFlow 时出现以下错误 2018 09 15 18 56 51 011724 E tensorflow core common runtime direct session cc 158 Intern
仅在三个侧面有多个插入框阴影和 alpha 透明度的阴影

目标是让元素具有微妙的开始box shadow底部边缘不受任何阴影影响我尝试玩弄阴影的值但没有成功更糟糕的是颜色具有透明度这意味着我不能简单地将三角形与元素重叠以隐藏阴影线有任何想法吗 nav background color
iOS 13 UITableViewCell自定义accessoryView出界

使用最新的 iOS 13 Beta 我真的不明白这是测试版的问题还是我的问题但我的 iOS 12 没有这个问题 code let button UIButton type custom button setTitle connect fo
给定 OpenCV/Python 中勾勒出“S”形状边缘的轮廓，可以使用哪些方法沿着形状中心追踪曲线？

给定一个勾勒出字母 S 边缘的轮廓例如在漫画中我怎样才能沿着该字母的脊柱获得一系列点以便稍后使用直线三次样条或其他曲线表示技术来表示该形状我想在 Python OpenCV 中使用 30 40 个点来处理和表示形状形态骨架化可
为什么标签在 ASP.NET 图表中消失？

Chart1 显示了所有标签但是一旦我添加第 10 个项目一半标签就消失了首先是标记
如果 QWebView 从 qresources 加载 html 文件，则不会加载任何外部资源

正如标题中所述我的问题是 qwebview 无法正确加载位于我的资源中的 html 文件如果我从资源外部将其作为普通本地文件加载它会完美加载它但这对我来说不是一个选择我想将该文件与应用程序捆绑在一起编辑顺便说一句我正在谈论来
React Hooks 静态变量：对象属性与 useRef()

在 React 函数组件中声明静态变量有什么优点或缺点useRef 钩子与简单地将它们声明为对象属性 useRef 方法 import React useRef from react const MyComponent gt const s
如何以角度禁用模板驱动表单中的所有字段

我用 Angular 5 创建了一个模板驱动表单我想首先禁用整个表单并且还希望在单击某个按钮后启用表单因此我在表单标记中添加了一个禁用属性并将其值设置为 false 如下所示这不起作用尽管
i18next 检查未使用的翻译

我想知道是否有人知道检查未使用翻译的好方法工具包我见过它用于 Rails 例如 i18n tasks 但没有用于 React 我目前正在使用react i18next 但它可以是任何可以查看您的翻译文件的内容预先非常感谢列出未使用
requestPermission：如何等待直到被授予？

Android API 23 及更高版本要求在运行时确认危险权限根据其他 StackOverflow 建议我使用 checkSelfPermissions 检查所需的权限如果需要则调用 requestPermissions 这工
以编程方式设置默认代理而不是使用 app.config

由于位于代理后面我的 Net 4 0 C 应用程序仅在存在包含以下内容的 app config 时才能工作
R中xtabs和aggregate之间的na.action不一致

我有以下数据框 x lt data frame A c Y Y Z NA B c NA TRUE FALSE TRUE C c TRUE TRUE NA FALSE 我需要计算下表xtabs A B C Y 1 2 Z 0 0
使用 PHP 发送电子邮件（防止被放入垃圾邮件文件夹）

我正在尝试使用 PHP 脚本发送电子邮件但是收件人在他她的垃圾邮件文件夹中收到它这不是所需的结果我希望将其直接发送到他们的收件箱这样我就不会必须警告他们查看垃圾邮件文件夹下面是我使用 PEAR 发送电子邮件的代码我可以进行哪
为什么 ARM 使用两条指令来屏蔽一个值？

对于以下功能 uint16 t swap const uint16 t value return value lt lt 8 value gt gt 8 为什么带 O2 的 ARM gcc 6 3 0 会产生以下程序集 swap unsig

为什么 ARM 使用两条指令来屏蔽一个值？

为什么 ARM 使用两条指令来屏蔽一个值？ 的相关文章

随机推荐

热门标签

为什么 ARM 使用两条指令来屏蔽一个值？的相关文章