这个 128 位整数乘法在汇编 (x86-64) 中如何工作？

2023-11-24

我正在阅读计算机系统：程序员的视角作业是描述这个算法是如何工作的。

C函数：

void store_prod(__int128 *dest, int64_t x, int64_t y) {
    *dest = x * (__int128)y;
}

集会：

movq %rdx, %rax
cqto
movq  %rsi, %rcx
sarq  $63,  %rcx
imulq %rax, %rcx
imulq %rsi, %rdx
addq  %rdx, %rcx
mulq  %rsi
addq  %rcx, %rdx
movq  %rax, (%rdi)
movq  %rdx, 8(%rdi)
ret

我不知道为什么它会执行：xh * yl + yh * xl = value which we add after unsigned multiplication

一如既往，编译器选项很重要。该源代码与gcc -Og（针对调试进行优化）生成与您的清单非常相似的 asm（在进行完整的 128x128 => 128 位乘法之前，强制转换将两个操作数符号扩展为 128 位）。这是 C 标准所说应该发生的事情的简单实现（用于将两个操作数转换为相同类型的整数优先规则）。

如果您要谈论编译器输出，您应该始终说明哪个版本的哪个编译器以及哪个选项。或者只是发布一个链接到godbolt，就像上面那个一样。（编辑：哎呀，源代码和 asm 来自一本没有提供该信息的书。如果那是 CS:APP 3e 的全球版本，请注意练习题充满了错误在全球版中。）

With gcc -O3 or -O2，GCC 利用了两个操作数实际上仍然只有 64 位的事实，所以单个imul足够。（这仍然为每个输入产生相同的结果，因此仍然按照 as-if 规则实现 C 逻辑。C 没有扩展操作，因此您被迫以“低效”方式编写源代码，这取决于编译器将其转换为高效的 asm。）

The sar $63, %rcx是符号扩展的一部分rsi into rcx:rsi，就像cqto符号扩展rax into rdx:rax。它用原始符号位的副本替换 RCX 的每一位。

这个答案的大部分已经由其他人在评论中给出，但我认为其他人没有注意到这一点gcc -Og / -O1几乎完全给出了 asm 输出。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

这个 128 位整数乘法在汇编 (x86-64) 中如何工作？的相关文章

如何转发声明要在 unique_ptr 的标准容器中使用的类

在智能指针的标准容器中使用它时是否可以避免完整的类定义可见例如我无法编译以下内容 include
OpenCV SVM 给出奇怪的预测结果

我对 OpenCV 和支持向量机都很陌生我想使用 SVM 训练具有两个标签的数据集然后预测给定集合的标签我当前的集合包含大约 600 行具有相等的类分布 1 为 300 行 1 为 300 行包含 34 列这是我当前用于设置 O
C++：字符串流有什么好处？

谁能告诉我一些在 C 中使用字符串流的实际例子即使用流插入和流提取运算符输入和输出到字符串流您可以使用字符串流来转换任何实现operator lt lt 到一个字符串 include
提取单花括号内的值

我想要一个收藏 value 一个字符串使用正则表达式例如 lorem ipsum field1 lorem ipsum field2 lorem ipsum field1 lorem ipsum field2 field3 我会得到 fi
带有嵌入 Flash 视频的 PDF 示例？

有谁知道我在哪里可以查看嵌入 Flash 视频的 PDF 示例我知道问这个问题很愚蠢因为你会认为任何面向技术的用户都应该能够使用谷歌找到一个但我真的找不到我的另一个问题是使用 C 中的 API 将 Flash 视频嵌入 PDF 文
析构函数与成员函数竞赛

当我在析构函数内时其他线程是否可能开始执行对象的成员函数遇到这种情况该如何处理呢 C 没有内在的保护来防止在删除对象后使用它忘记竞争条件另一个线程可以在完全删除你的对象后使用你的对象 Either 确保只有一个位置代码拥有该对象
将视频上传/保存到数据库或文件系统

我以前从未尝试过保存视频所以我对此了解不多我知道如果视频很小我可以转换为字节数组并保存到数据库但是为了提高效率我想了解如何将任何上传的视频保存到我的服务器文件中然后只保存该文件的文件路径我的数据库表中的视频我完全不知道如何开始
为什么我收到编译错误“使用已删除的函数 'std::unique_ptr ...”

我收到一条巨大的编译错误消息 c mingw include c 6 1 0 bits predefined ops h 123 18 error use of deleted function std unique ptr lt Tp D
将 std::pair const 转换为 std::pair const 安全吗？

理论上或实践上安全吗reinterpret cast a std pair
可以通过模板间接访问基类中的私有类型

我试图在编译时根据类型是否在给定范围内公开可用来选择要使用的类型最好直接看代码 include
在 Linq 查询中使用动态列名称

foreach Dimension dimensions in Enum GetValues typeof Dimension var r new ReferenceTable dimensions referenceItems List
使用 FromBase64Transform 解码 base64 文件流

The example https msdn microsoft com en us library system security cryptography frombase64transform 28v vs 110 29 aspx从M
ef core 在更新数据库期间不使用 ASPNETCORE_ENVIRONMENT

我使用 Visual Studio 通过一定的迁移来更新我的所有环境使用下面的命令效果很好 update database Migration initMigrationProduct c ProductContext Environme
当分配返回 0 时，具有空异常规范的运算符 new 调用构造函数

我有以下声明 void operator new size t s PersistentMemory m throw return m gt allocatePersistentMemory s 我正在测试启动时的内存耗尽这会导致m gt
Rx 在不同的线程上生产和消费

我试图通过此处的示例代码来简化我的问题我有一个生产者线程不断地输入数据并且我尝试在批次之间添加时间延迟来对其进行批处理以便 UI 有时间渲染它但结果并不如预期生产者和消费者似乎在同一个线程上我不希望批处理缓冲区在正在生成的线程上
快速将文本附加到文本框

我有一个BackgroundWorker正在发布消息的线程使用BeginInvoke在 GUI 中的文本框中方法 write debug text 在文本框中显示文本使用AppendText并将文本写入Console 外观上是这样的Ba
NSubstitute - 测试特定的 linq 表达式

我在当前正在开发的 MVC 3 应用程序中使用存储库模式我的存储库界面如下所示 public interface IRepository
从数据库配置中的连接字符串中删除 SSIS 密码

我有一个 SSIS 包它使用 SQL 服务器中的 SSIS 配置表来检索 OLE DB 连接管理器的连接字符串属性问题是我还需要相同的连接字符串来调用使用实体框架的程序集我尝试访问连接管理器连接字符串属性但 SSIS 总是删除密码
如何从 C# 中的 Web Api 方法正确获取字节数组？

我有以下控制器方法 HttpPost Route SomeRoute public byte MyMethod FromBody string ID byte mybytearray db getmybytearray ID working
从 C/C++ 程序进行 Ping

我想编写一个 C 或 C 程序给定一个 IP 地址对其进行 Ping 然后根据 Ping 是否成功执行进一步的操作这个怎么做尽情享受Ping 页面 http www ping127001 com pingpage htm 其中有一个

随机推荐

glVertexAttribPointer 内置顶点属性，如 gl_Vertex、gl_Normal

我必须使用 glVertexAttribPointer 将顶点属性发送到期望它们作为内置的着色器 gl Vertex gl Color etc The glVertexAttribPointer函数需要指定每个内置属性的索引或位置我可以
使用不同的 SQL 查询批量准备语句

我发现现有的问题similar对于这个问题实际上并没有明确的答案带有一个 sql 查询的普通批处理准备语句将如下所示 private static void batchInsertRecordsIntoTable throws SQLEx
视图的 SELECT 在 FROM 子句中包含子查询

我有两个表我需要创建一个视图这些表格是 credit orders id client id number of credits payment status credit usage id client id credits used
带有CSS三角形的边框半径

I have 一个矩形对角线的每一边都有自己的颜色 div width 0 height 0 border left 150px solid green border top 100px solid gray 现在我想向 div 添加边框半
使我的 NumPy 数组跨进程共享

我已经阅读了很多关于共享数组的问题对于简单的数组来说它似乎足够简单但我一直试图让它适用于我拥有的数组 import numpy as np data np zeros 250 dtype float32 250000 2 float3
在node.js中加载并执行外部js文件并访问局部变量？

做一个简单的事情是否容易可能include path to file Node js 中的命令类型我想做的就是访问局部变量并运行脚本人们通常如何组织比简单的 hello world 更大的 Node js 项目功能齐全的动态网站例
Excel 是否计算提供给 IF 函数的两个结果参数？

Excel s if函数采用三个参数一个条件一个 if true 值和一个 if false 值 Excel 是否计算出所有三个参数的值还是仅计算条件的值和相应的结果澄清我不知道是什么result of the if将会是我想知
init 方法中的 [self release]、[self dealloc] 或 [super dealloc] ？

我刚刚阅读了有关如何在 init 方法中正确失败的内容并且文档似乎彼此不同意一种建议抛出异常另一种则建议清理并返回 nil 目前的最佳实践是什么我相信普遍接受的做法是失败时返回零但你确实想释放 self 以避免泄漏 id init
如何等待数据写入管道的另一端

我正在用 C 语言开发一个应用程序父进程和子进程通过管道进行通信在写入管道之前父进程执行另一个语句在示例代码中我使用 sleep 10 来进行延迟在子进程中它应该从管道读取数据但是子进程中管道的读取端不会读取数据 int m
使用 JSoup 提取图像 src

我正在尝试使用 jsoup 从此网页中提取所有图像网址任何人都可以提供有关如何做到这一点的帮助吗所有标签的格式都是这样的但我只需要 src 图像而不是 ajaxsrc img src http image cdnllnwnl xos
使用 BACK 键隐藏键盘事件

我注意到在Android Market Application 当您单击搜索按钮时它会显示键盘但是当您单击back按钮搜索EditText变得不可见并且keyboard被隐藏问题是我无法隐藏EditText按后退键后隐藏键盘后因为
Visual Studio自定义构建步骤规则？

使用 Visual Studio 2008 当我向 C 项目添加一个不存在的文件时 c cpp h rc或者 IDE 无法识别的任何内容都会弹出一个对话框询问我是否要为此类文件创建自定义构建步骤规则有谁知道如何在不添加文件的情况下进入
[A]如何在javafx中使MP3重复播放？

我希望我的 mp3 文件在完成后再次重复但我无法创建循环来重复播放我的文件我使用了这段代码但只有它在完成后播放我的文件的第一秒 AudioClip myMusic myMusic setCycleCount AudioClip IND
代码检查 - 命名范围参考

在 Rubberduck 2 0 11 2453 中运行代码检查后有 4 个范围引用被标记为成员 Range 隐式引用 ActiveSheet 有问题的范围是指命名范围是否有必要限定命名范围引用 Private Sub RunORat
gcc生成目标文件时创建目录

gcc o abc def o def c产生def o目录中的文件abc 仅当目录存在时abc 当生成的目标文件的封闭目录不存在时有没有办法让 gcc 创建一个目录如果没有那么提前自动创建目录尤其是 Makefile 的最简单方法
将 rowversion 转换为 bigint

在我的 C 程序中我不想使用字节数组因此我将 rowversion 数据类型转换为 bigint SELECT CAST version AS BIGINT FROM dbo mytable 所以我收到一个数字而不是字节数组这种转换总
在 sphinx 文档中包含独立的 HTML 页面

对于我的项目的大部分文档我更喜欢标准的 sphinx 布局然而对于登陆页面我更喜欢使用自定义 HTML CSS JS 而不使用普通 sphinx 网站的任何布局目录或侧边栏有没有一种方法可以在 sphinx 生成的网站中包含原始
自定义属性未在样式和主题内解析

我有一个带有自定义主题的 Android 应用程序该应用程序是 2 3 年前开发的我有这个风格attr xml资源文件
如何在同一端口 4200 上运行 Angular 4 应用程序和 NodeJS api 以进行生产和开发？

我已经创建了 Angular 4 应用程序我可以使用它来运行它ng serve open它运行在localhost 4200 我想要的是我还使用创建了 apinodejs现在在同一个角度项目中我想运行该 APIlocalhost 4200
这个 128 位整数乘法在汇编 (x86-64) 中如何工作？

我正在阅读计算机系统程序员的视角作业是描述这个算法是如何工作的 C函数 void store prod int128 dest int64 t x int64 t y dest x int128 y 集会 movq rdx rax cqt

这个 128 位整数乘法在汇编 (x86-64) 中如何工作？

这个 128 位整数乘法在汇编 (x86-64) 中如何工作？ 的相关文章

随机推荐

热门标签

这个 128 位整数乘法在汇编 (x86-64) 中如何工作？的相关文章