在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位

2024-01-01

我正在尝试为 ia32 的 CMPXCHG8B 编写 GCC 内联汇编。不，我不能使用__sync_bool_compare_and_swap。它必须在有或没有 -fPIC 的情况下工作。

到目前为止我最好的（EDIT：毕竟不起作用，请参阅下面我自己的答案以了解详细信息）是

register int32 ebx_val asm("ebx")= set & 0xFFFFFFFF;
asm ("lock; cmpxchg8b %0;"
     "setz %1;"
     : "+m" (*a), "=q" (ret), "+A" (*cmp)
     : "r" (ebx_val), "c" ((int32)(set >> 32))
     : "flags")

但我不确定这实际上是否正确。

我不能做"b" ((int32)(set & 0xFFFFFFFF))对于 ebx_val 由于 PIC，但显然register asm("ebx")变量被编译器接受。

BONUS： ret 变量用于分支，因此代码最终如下所示：

cmpxchg8b [edi];
setz cl;
cmp cl, 0;
je foo;

知道如何描述输出操作数，使其变为：

cmpxchg8b [edi]
jz foo

谢谢。

下面的怎么样，这在一个小测试中似乎对我有用：

int sbcas(uint64_t* ptr, uint64_t oldval, uint64_t newval)
{
    int changed = 0;
    __asm__ (
        "push %%ebx\n\t" // -fPIC uses ebx, so save it
        "mov %5, %%ebx\n\t" // load ebx with needed value
        "lock\n\t"
        "cmpxchg8b %0\n\t" // perform CAS operation
        "setz %%al\n\t" // eax potentially modified anyway
        "movzx %%al, %1\n\t" // store result of comparison in 'changed'
        "pop %%ebx\n\t" // restore ebx
        : "+m" (*ptr), "=r" (changed)
        : "d" ((uint32_t)(oldval >> 32)), "a" ((uint32_t)(oldval & 0xffffffff)), "c" ((uint32_t)(newval >> 32)), "r" ((uint32_t)(newval & 0xffffffff))
        : "flags", "memory"
        );
    return changed;
}

如果这也被错误编译，您能否添加一个触发此行为的小片段？

关于奖金问题，我认为不可能使用来自的条件代码在汇编器块之后进行分支cmpxchg8b说明（除非您使用asm goto或类似的功能）。从GNU C 语言扩展 http://tigcc.ticalc.org/doc/gnuexts.html#SEC94:

寻找一种方法来访问汇编指令留下的条件代码是一个很自然的想法。然而，当我们尝试实现这一点时，我们发现没有办法让它可靠地工作。问题是输出操作数可能需要重新加载，这将导致额外的后续“存储”指令。在大多数机器上，这些指令会在有时间测试之前更改条件代码。对于普通的“测试”和“比较”指令，不会出现此问题，因为它们没有任何输出操作数。

编辑：我找不到任何指定一种方式或另一种方式是否可以在使用时修改堆栈的来源%N输入值（This http://www.delorie.com/djgpp/doc/brennan/brennan_att_inline_djgpp.html古老的链接说“你甚至可以将寄存器压入堆栈，使用它们，然后将它们放回去。”但该示例没有输入）。

但应该可以通过将值固定到其他寄存器来做到这一点：

int sbcas(uint64_t* ptr, uint64_t oldval, uint64_t newval)
{
    int changed = 0;
    __asm__ (
        "push %%ebx\n\t" // -fPIC uses ebx
        "mov %%edi, %%ebx\n\t" // load ebx with needed value
        "lock\n\t"
        "cmpxchg8b (%%esi)\n\t"
        "setz %%al\n\t" // eax potentially modified anyway
        "movzx %%al, %1\n\t"
        "pop %%ebx\n\t"
        : "+S" (ptr), "=a" (changed)
        : "0" (ptr), "d" ((uint32_t)(oldval >> 32)), "a" ((uint32_t)(oldval & 0xffffffff)), "c" ((uint32_t)(newval >> 32)), "D" ((uint32_t)(newval & 0xffffffff))
        : "flags", "memory"
        );
    return changed;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位的相关文章

难以理解汇编命令“加载有效地址”[重复]

这个问题在这里已经有答案了可能的重复 LEA 指令的目的是什么 https stackoverflow com questions 1658294 whats the purpose of the lea instruction LEA指
64 位 Windows 汇编器

我想对 64 位 Windows 程序集进行编程最好使用 NASM 我在 google 上查了一下但似乎找不到 64 位 Windows 编译器有些网站提到了ml64 但它似乎不再包含在VC 中我尝试过 32 位程序集但显然它在我
具有自定义值类型的 map::emplace()

我使用时遇到问题map emplace 谁能帮我找出正确的语法来使用我实际上正在尝试做同样的事情这个例子 http www cplusplus com reference map map emplace 这是我的版本 include
使用 gcc 理解共享库

我试图理解 C 中共享库的以下行为机器一 cat one c include
使用 ACPI 在 MS-DOS 中关闭计算机

我在基于 Pentium 的计算机上运行 MS DOS 6 22 主板支持 ACPI 并且想知道是否有一个可以用来关闭计算机的汇编语言例程或者它是否比那个更难即主板具体的基本上我想创建一个小程序来从命令行关闭计算机这是专门为此编
将 XMM 寄存器压入堆栈

有没有办法将打包双字整数从 XMM 寄存器推送到堆栈然后在需要时将其弹出理想情况下我正在寻找通用寄存器的 PUSH 或 POP 之类的东西我已经检查了英特尔手册但我要么错过了命令要么没有或者我是否必须将值解压到通用寄存器然后推
为什么 g++ 在编译的二进制文件中存储类名？

我注意到如果我跑strings在我编译的程序上g 输出包含它使用的各种类的名称该程序是用 O3并且没有 g or p 并且当我剥离二进制文件时类名仍然存在我想知道为什么有必要g 将此信息存储在二进制文件中出现的类名似乎都是使用虚函数
intfmt: db "%d", 10, 0 在汇编中的含义

我最近在我的一个汇编文件的顶部看到了这个并意识到我在打印整数的过程中花了很长时间使用它而没有真正意识到它最初来自哪里在我的基本汇编模板中使用或 10 0 是什么结尾的意思是 section data intfmt db d 10 0
gcc 的 std::bind 在源代码中的哪个位置将参数复制到数据结构中？

在试图了解在什么情况下std bind分配内存我看了这个答案 https stackoverflow com a 25403584 391161 这给出了一些直觉但我想要更详细的理解所以我去查看了源代码gcc 我正在检查以下源代码 h
如何构建gcc multilib工具链？

我正在尝试在新安装的 ubuntu 14 04 的 AMD64 版本上构建 gcc multilib 工具链它只有 x86 64 gcc 和 g 安装没有 multilib 支持我的配置行是 configure disable che
INT 13h 无法读取超出特定扇区的数据

我正在为我的操作系统编写内核在将磁盘扇区加载到内存时遇到问题以下是从磁盘加载扇区的函数代码部分 mov ax 0x3000 mov es ax mov ax 0x0201 mov bx word ptr bp 6 bx 0x000 0x
如何在汇编中使用 ReadString？

mov edx offset Prompt1 call WriteString mov ecx 32 mov edx offset String1 call ReadString 现在我该如何访问String1 如何将其移入寄存器以便对其
致命错误：Python.h：没有这样的文件或目录，python-Levenshtein 安装

首先我正在使用 Python 3 7 开发 Amazon EC2 实例 Amazon linux 版本 2 AMI 我正在尝试使用以下命令安装 python Levenshtein 包 pip3 install python Levens
如何使 gcc 为 -fpatchable-function-entry 发出多字节 NOP？

gcc确实有能力使用多字节用于对齐循环和函数的 NOP 然而当我尝试 fpatchable function entry option https gcc gnu org onlinedocs gcc Instrumentation Opt
GCC 详细模式输出解释

我是 Linux 新手谁能向我解释一下我的 hello world 程序的以下详细模式输出另外这些文件是做什么用的crt1 o crti o crtend o crtbegin o and crtn o and lc and lgcc
Gnu C++ 何时会在没有明确要求的情况下支持 C++11？

目前使用 g 4 8 1 您必须通过以下方式在 C 11 模式下编译文件 g std c 11 o prog x prog cpp 当我只能说的时候有计划吗 g o prog x prog cpp 编译prog cpp Maybe pro
python gcc编译错误

我知道 gcc 上有很多线程特别是 command gcc failed with exit status 1 我已经查看了所有线程但仍然无法解决此问题我只会使用 gcc 或 mingw32 来执行与 python 相关的任务例如使
GCC C++ pow 精度

所以我在参加一个计算竞赛时我注意到一个奇怪的错误 pow 26 2 总是返回 675 有时返回 674 即使正确答案是 676 pow 26 3 pow 26 4 等也会出现此类错误经过比赛后的一些调试我相信答案与 int 向下舍入的
mfence 和 asm 易失性 ("" : : : "内存") 的区别

据我了解 mfence是硬件内存屏障而asm volatile memory 是编译器障碍但是可以asm volatile memory 用来代替 mfence 我感到困惑的原因是这个链接 http gcc gnu org ml gc
嵌入式系统中的malloc [重复]

这个问题在这里已经有答案了我正在使用嵌入式系统该应用程序在 AT91SAMxxxx 和 cortex m3 lpc17xxx 上运行我正在研究动态内存分配因为它会极大地改变应用程序的外观并给我更多的力量我认为我唯一真正的路线是为

随机推荐

在 MVC3 中扩展不显眼的 javascript 以将样式添加到 div 客户端的最佳方法

我正在使用 html5 Razor MVC3 利用 Twitter 的 Bootstrap 模板我想要表单验证看起来像他们记录的那样光滑 http twitter github com bootstrap forms http twitt
使用 boto，在 s3 上已存在的文件上设置 content_type

我正在使用 django 存储和 s3boto 后端根据这个问题 http code larlet fr django storages issue 5 s3botostorage set content type header acl
Redux Toolkit Streaming 更新 - 如何处理关系实体适配器？

我正在处理使用 RTK 查询和实体适配器的聊天我目前有 2 个不同的实体适配器一种用于聊天一种用于消息如何选择特定聊天的所有消息我是否需要在聊天适配器内存储消息 id 数组还是选择所有消息并按parent chat uuid 属
Spring Web Flow 防止后退按钮使用

因此我在项目上使用 Spring Web Flow 并希望在元素上使用history discard 和history invalidate 属性我已将这些属性放置在我想要的位置但是当我在转换上运行历史记录属性后尝试通过导航到视图来
UWP - 将 TextBox.Text 绑定到 Nullable

目前无法绑定到任何内容这是正确的吗 Nullable
使用命名元组多处理对象 - Pickling 错误

我在想要放入多重处理的对象中使用命名元组时遇到问题我收到酸洗错误我尝试了其他 stackoverflow 帖子中的一些方法但没有成功这是我的代码的结构包主测试模块 import myprogram package of clas
Cassandra数据复制问题

我有一个 2 节点 cassandra 集群复制因子为 2 并且 AutoBootStrap true 启动期间一切正常两个节点都能看到对方我们将这些节点称为 A 和 B 通过节点 A 将一组键和列我们称之为 K1 添加到 cass
Swift 3：如何使用 AVVideoComposition 导出带有文本的视频

我正在尝试使用AVVideoComposition在视频顶部添加一些文本并保存视频这是我使用的代码 I 创建一个AVMutableComposition and AVVideoComposition var mutableComp AVM
避免每次都执行 adb tcpip 5555

我喜欢能够通过 WIFI 使用 ADB 来操作我的 Android 手机通过 USB 连接后我运行adb tcpip 5555 然后我可以断开 USB 并运行adb connect phone s IP 5555 我不喜欢的是每次我必
如何使用反应钩子获取网络摄像头？

我正在尝试使用 React hooks 将网络摄像头源显示在我的应用程序上我还需要能够从提要中捕获最新的图像我相信我有基础但缺少一些东西 import React useState useEffect from react expor
如何在 dynamodb 本地执行更新

目前我有 amazon dynamodb local 的本地图像每当我尝试对数据库执行更新操作时它都会创建一个重复行而不是更新现有记录我的表定义是 TableName commission KeySchema AttributeNam
禁用 Chromium“无法更新 Chromium”窗口通知

我们在触摸屏 Linux 上以 kiosk 模式运行 Google Chromium 我们经常收到无法更新 Chromium 窗口通知我们还没有找到可以阻止这种情况的标志有人有主意吗这个Bug似乎四处飘荡Debian https b
“代表”发送电子邮件

我收到了很多代表的电子邮件例如 AddThis 插件代表从 addThis com 发送电子邮件电子邮件受保护 cdn cgi l email protection 如何在 C ASP NET 中执行此操作另外如果我们使用 gm
Android 上视图背景颜色的动画变化

如何在 Android 上以动画方式改变视图的背景颜色例如我有一个背景色为红色的视图视图的背景颜色更改为蓝色如何在颜色之间实现平滑过渡如果无法通过视图来完成此操作则欢迎使用替代方案您可以使用新的属性动画 API http de
IList 构造函数参数和 AutoFixture

Using 自动夹具 http autofixture codeplex com 我正在尝试构造匿名实例Project f new Fixture Customize new AutoMoqCustomization p f CreateA
在 Django 中使用电子邮件地址或用户名登录用户

我正在尝试创建一个身份验证后端以允许我的用户使用他们的电子邮件地址或 Django 1 6 中的用户名和自定义用户模型登录当我使用用户名登录时后端可以工作但由于某种原因不能使用电子邮件登录有什么我忘记做的事情吗 from djang
我们可以使用亚马逊产品广告 API 只获取亚马逊 Prime 产品吗？

我已经搜索了如何使用亚马逊产品广告 API 现在我可以使用亚马逊产品广告 API 搜索不同的产品并且工作正常但据我所知我们只能从我们的帐户获得亚马逊 Prime 产品当我使用亚马逊网站登录亚马逊帐户并搜索任何产品时我只找到亚马逊
根据 csv 文件的列名创建选择列表，以便在 Shiny 中绘图

我正在尝试构建一个闪亮的应用程序我可以在其中上传 csv 文件并根据列名称填充 ui 中左列滑动栏列上的复选框根据为 y 轴选择的列和为 x 轴选择的列需要能够使用 ggplot 创建图表我的 ui R 看起来像这样 shiny
Google Calendar JavaScript api，将用户添加到具有“写入”访问权限的日历

我正在开发一个与 Google 日历相关的网站该网站使用 Google 的 JavaScript API 来检索公共日历的事件并将其呈现在网站上我现在可以在我的网站上创建新活动更新活动和删除活动并且可以毫无问题地在 Google 日
在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位

我正在尝试为 ia32 的 CMPXCHG8B 编写 GCC 内联汇编不我不能使用 sync bool compare and swap 它必须在有或没有 fPIC 的情况下工作到目前为止我最好的 EDIT 毕竟不起作用请参阅下面我

在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位

在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位 的相关文章

随机推荐

热门标签

在 GCC 内联汇编中包装 CMPXCHG8B 的正确方法，32 位的相关文章