asm volatile ("" : : : "内存") 的工作原理

2024-02-08

基本上是什么__asm__ __volatile__ ()做了什么以及有什么意义"memory"对于ARM架构？

asm volatile("" ::: "memory");

创建编译器级内存屏障，迫使优化器不跨屏障重新排序内存访问。

例如，如果您需要以特定顺序访问某个地址（可能是因为该内存区域实际上由不同的设备而不是内存支持），您需要能够告诉编译器，否则它可能只会优化您的步骤为了效率。

假设在这种情况下，您必须增加地址中的一个值，读取某些内容并增加相邻地址中的另一个值。

int c(int *d, int *e) {
        int r;
        d[0] += 1;
        r = e[0];
        d[1] += 1;
        return r;
}

问题是编译器（gcc在这种情况下）可以重新安排你的内存访问以获得更好的性能，如果你要求的话（-O）。可能会导致如下所示的一系列指令：

00000000 <c>:
   0:   4603        mov r3, r0
   2:   c805        ldmia   r0, {r0, r2}
   4:   3001        adds    r0, #1
   6:   3201        adds    r2, #1
   8:   6018        str r0, [r3, #0]
   a:   6808        ldr r0, [r1, #0]
   c:   605a        str r2, [r3, #4]
   e:   4770        bx  lr

以上数值为d[0] and d[1]同时加载。假设这是您想要避免的事情，那么您需要告诉编译器不要重新排序内存访问，即使用asm volatile("" ::: "memory").

int c(int *d, int *e) {
        int r;
        d[0] += 1;
        r = e[0];
        asm volatile("" ::: "memory");
        d[1] += 1;
        return r;
}

所以你会得到你想要的指令序列：

00000000 <c>:
   0:   6802        ldr r2, [r0, #0]
   2:   4603        mov r3, r0
   4:   3201        adds    r2, #1
   6:   6002        str r2, [r0, #0]
   8:   6808        ldr r0, [r1, #0]
   a:   685a        ldr r2, [r3, #4]
   c:   3201        adds    r2, #1
   e:   605a        str r2, [r3, #4]
  10:   4770        bx  lr
  12:   bf00        nop

应该注意的是，这只是编译时内存屏障，以避免编译器重新排序内存访问，因为它没有放置额外的硬件级指令来刷新内存或等待加载或存储完成。如果 CPU 具有架构功能并且内存地址有效，它们仍然可以对内存访问进行重新排序normal键入而不是strongly ordered or device (ref http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.ddi0211k/Babcddgd.html).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

gcc

arm

embeddedlinux

volatile

asm volatile ("" : : : "内存") 的工作原理的相关文章

与 MinGW 的静态和动态/共享链接

我想从一个简单的链接用法开始来解释我的问题假设有一个图书馆z它可以编译为共享库 libz dll D libs z shared libz dll 或静态库 libz a D libs z static libz a 让我想要链接它然后
并行运行多个任务

我有一个代理列表每个代理都会访问不同的站点并从站点中提取所需的数据目前它一次只做一个但我希望同时运行 10 20 个任务这样它就可以一次性从 20 个站点下载而不是只下载一个这是我目前正在做的事情 private async T
SOAP Web 服务：多台服务器，一个接口

我有一个场景需要任意数量的服务器来提供相同的 SOAP Web 服务我想生成一组代理类并能够为它们提供一个位置以便在运行时将它们指向不同的服务器不幸的是看起来好像wsdl port节点子节点wsdl service 要求对特定
如何在 C++ 中为指针“this”赋值

在函数中如何分配this一个新的价值您可以分配对象this点于 this XY 但你不能分配直接值this this XY Error Expression is not assignable
从结构调用 C++ 成员函数指针

我找到了有关调用 C 成员函数指针和调用结构中的指针的信息但我需要调用结构内部存在的成员函数指针但我无法获得正确的语法我在类 MyClass 的方法中有以下代码片段 void MyClass run struct int MyClas
如何在 Linux 上重新实现（或包装）系统调用函数？

假设我想完全接管 open 系统调用也许要包装实际的系统调用并执行一些日志记录一种方法是使用 LD PRELOAD http scaryreasoner wordpress com 2007 11 17 using ld preload
大量互斥体对性能的影响

假设我有一个包含 1 000 000 个元素的数组以及多个工作线程每个线程都操作该数组中的数据工作线程可能会使用新数据更新已填充的元素但每个操作仅限于单个数组元素并且独立于任何其他元素的值使用单个互斥锁来保护整个数组显然会导致高
自己绘制的WPF自定义滑块

这是我关于堆栈溢出的第一个问题所以不要踢它我在尝试创建 Mac 风格的滑块控件时遇到问题我已经发现这个解决方案 http www codeproject com KB miscctrl MAC Slider aspx我已经在我的解决方
注入包含接口的所有已注册实现的 Enumerable

给出以下接口 public interface IMyProcessor void Process 我希望能够注册多个实现并让我的 DI 容器将它们的可枚举注入到这样的类中 public class MyProcessorLibrary
使用 STL 流时如何格式化我自己的对象？

我想将我自己的对象输出到 STL 流但具有自定义格式我想出了这样的东西但由于我之前从未使用过 locale 和 imbue 所以我不知道这是否有意义以及如何实现 MyFacet 和operator 所以我的问题是这是否有意义以及如何
DateTime.ParseExact - 为什么 yy 变成 2015 而不是 1915

为什么 NET 假定以下年份是 2015 年而不是 1915 年 var d DateTime ParseExact 20 11 15 dd MM yy new CultureInfo en GB 我想它会尝试接近但其背后是否有合理的
如何在 C++ 中正确使用 cin.fail()

我正在编写一个程序从用户那里获取整数输入cin gt gt iUserSel 如果用户输入一个字母程序就会进入无限循环我试图用下面的代码来阻止这种情况但程序进入无限循环并打印出错误输入我该如何修复我的程序 cin gt gt
如何从 Powerpoint 2010 导出电影？

如何使用 MS Office PIA 主互操作程序集或其他方式以编程方式将嵌入视频从 powerpoint 2010 导出到外部文件在演示文稿中嵌入视频是 Powerpoint 2010 中的一项新功能我找不到解决方案 PPTX 文件
为什么这个位图图像在加载后会改变大小？

快速提问我有这个1000 1000位图图像我使用这个例程来加载它 private BitmapSource initialBitmap new BitmapImage new Uri C Users Desktop Original b
从单应性估计 R/T

我一直在尝试计算 2 个图像中的特征然后将这些特征传递回CameraParams R没有运气特征已成功计算并匹配但是问题是将它们传递回R t 我明白你必须分解Homography为了使这一点成为可能我已经使用如下方法完成了 http
g++ / gcc 是否支持 C++20 新的atomic_flag 功能？

根据参考参数 https en cppreference com w cpp atomic atomic flag c 20 有丰富的对我来说有用的支持atomic flag运营然而目前尚不清楚 gcc 是否支持这些功能它们在任何
c++ - <未解析的重载函数类型>

在我的班级里叫Mat 我想要一个将另一个函数作为参数的函数现在我有下面 4 个函数但是在调用 print 时出现错误第二行给了我一个错误但我不明白为什么因为第一行有效唯一的区别是功能f不是班级成员Mat but f2是失败的是
C# 多维数组解析

我有一个多维数组内容在调试器中看起来像这样数组设置为 String s new String 6 4 A B Yes C A B Yes C A B No C A B Yes C A B Yes C A B Yes C A B No C
为什么存在系统调用

我一直在阅读有关系统调用及其在 Linux 中如何工作的内容我还有更多的阅读要做但我读过的一件事都没有回答那就是为什么我们需要系统调用我知道系统调用是用户空间程序要求内核执行某些操作的请求但我的问题基本上是为什么用户空间程序本
NHibernate：无状态会话错误消息无法获取代理

我正在使用 nHibernate 无状态会话来获取对象更新一个属性并将对象保存回数据库我不断收到错误消息无状态会话无法获取代理我在其他地方有类似的代码所以我不明白为什么这不起作用有谁知道问题可能是什么我正在尝试更新Screen

随机推荐

如何在 Maven 之上通过 Netbeans 创建/使用类库？

这似乎是一个愚蠢的问题但我有点依赖 Netbeans 7 1 向导似乎没有选择可以做到这一点我的网络应用程序是用 Maven 构建的我想将它的一些包分解成一个独立构建和维护的类库特别是 JPA 部分但这不重要然后我想从原始 W
开发一个Android应用程序以支持英语和阿拉伯语“布局对齐”

我正在开发一个 Android 应用程序来支持 En Ar 但我面临一个问题如果用户从 En 更改为 Ar 用户界面的对齐方式必须从从左到右变为从右到左例子文本视图编辑文本这是在恩但在 Ar 中应该是编辑文本文本视图
在嵌入式c中通过RS232处理ASCII命令

我的微控制器有一个 RS232 接口带有一组预定义的命令有数百个命令例如PRESSURE 50可设定压力为50 LIMIT 60可以将限制设置为 60 目前这是使用一系列嵌套的 switch 语句来处理的但这似乎是一个不优雅的解决
Android Room 数据库忽略问题“尝试了以下构造函数，但它们无法匹配”

我的实体类 Entity tableName student data class Student var name String var age Int var gpa Double var isSingle Boolean Primar
使用 gulp 运行 Protractor 和 selenium 时出现问题

我是量角器的新手也是 gulp 任务的新手我有 gulp 文件如下所示 use strict var global app files spec e2e spec js folders specs specs var gulp req
如何从资源 URL 保存视频

我想将视频从资源 URL 保存到我的应用程序文档中我的资产网址如下 assets library asset asset MOV id 1000000394 ext MOV 我试过这个 NSString str assets librar
Dagger 2.0 构造函数注入和 Singleton

是否可以同时使用 Dagger 2 0 构造函数注入和单例我在文档中找不到答案 Example Singleton public class MyClass private final OtherClass member Inject p
获取 Azure 搜索中的实际匹配数

Azure 搜索一次最多返回 1 000 个结果对于客户端上的分页我想要总数匹配项以便能够在底部显示正确数量的分页按钮并能够告诉用户有多少结果但是如果超过一千个我如何获得实际数量我只知道有at least1 000 场比赛
Flink 模式演化不适用于 POJO 类

我有一个类满足被视为 POJO 的要求这是我的流媒体工作中的主要传输类它只包含原语和Map
IE8 CSS @font-face 字体仅适用于：内容结束之前，有时在刷新/硬刷新时

更新我写了一篇博客文章介绍我对这个问题的了解我仍然不完全理解它但希望有人能读到这篇文章并阐明我的问题 http andymcfee com 2012 04 04 icon fonts pseudo elements and ie8
adb 服务器版本与此客户端不匹配

每当我尝试跑步时adb devices adb devices daemon not running starting it now daemon started successfully List of devices attached
为什么在向上转换之后调用派生类的虚方法？

在向上转换派生类的指针后仍然调用派生类的虚拟方法这在我看来是错误的因为切片应该发生您能评论一下这段代码有什么问题吗 class Base public virtual void Hello cout lt lt Hello Base
为同一类的不同版本构建风味

我有一个项目结构如下 project src flavorA2 java com abc flavorA mk2 classA java classB java res AndroidManifest xml main
sklearn多类SVM函数

我有多个类标签想要计算模型的准确性我有点困惑我需要使用哪个 sklearn 函数据我了解以下代码仅用于二元分类 dividing X y into train and test data X train X test y train
具有自定义授权者的 AWS API Gateway 返回 AuthorizerConfigurationException

我有一个使用自定义授权方的 AWS API Gateway 如果请求获得授权它会触发另一个 lambda 函数从昨天开始每当我调用 API 时都会收到错误消息 message null 和 500 内部服务器错误在响应标头中它说x
在 Scala 中存储特定类类型的序列？

尝试找到一种有效且灵活的方法来在 Scala 中存储一系列类类型稍后我可以使用它来启动该类型的新实例 class Event val name String val channels Seq String val processors S
为什么 grep 提示“无效范围结束”？

我有一个文件a cat a abcd kaka 使用命令时 grep e a d a abcd kaka 效果很好但是为什么这些命令不正确呢 grep e x61 x74 a grep Invalid range end grep e u
为什么Python在执行前不发现错误？

假设我有以下 Python 代码 a WelcomeToTheMachine if a DarkSideOfTheMoon awersdfvsdvdcvd print done 为什么没有这个错误呢它是如何编译的在 Java 或 C 中
JLayeredPane 和绘画

我正在编写一个应用程序它有一个 JLayeredPane 称为层其中包含不同层中的两个 JPanel 我重写了底部 JPanel 的 PaintComponent 方法称为 grid panel 以便它绘制一个网格并重写顶部 JPa
__asm__ __volatile__ ("" : : : "内存") 的工作原理

基本上是什么 asm volatile 做了什么以及有什么意义 memory 对于ARM架构 asm volatile memory 创建编译器级内存屏障迫使优化器不跨屏障重新排序内存访问例如如果您需要以特定顺序访问某个地址可能是因

__asm__ __volatile__ ("" : : : "内存") 的工作原理

__asm__ __volatile__ ("" : : : "内存") 的工作原理 的相关文章

随机推荐

热门标签

asm volatile ("" : : : "内存") 的工作原理

asm volatile ("" : : : "内存") 的工作原理的相关文章