使用乘法执行整数除法[重复]

2024-04-20

查看编译器生成的 x86 程序集，我注意到（无符号）整数除法有时会实现为整数乘法。这些优化似乎遵循以下形式

value / n => (value * ((0xFFFFFFFF / n) + 1)) / 0x100000000

例如，除以 9：

12345678 / 9 = (12345678 * 0x1C71C71D) / 0x100000000

除以 3 将使用乘法0x55555555 + 1，等等。

利用这一事实mul指令将结果的高位部分存储在edx寄存器中，除法的最终结果可以使用与魔术值的单个乘法来获得。（尽管这种优化有时与最后的按位移位结合使用。）

我想了解一下这实际上是如何运作的。这种方法什么时候有效？为什么我们的“神奇数字”必须加 1？

该方法称为“除以不变乘法”。

您看到的常数实际上是倒数的近似值。

因此，而不是计算：

N / D = Q

你可以这样做：

N * (1/D) = Q

where 1/D是可以预先计算的倒数。

从根本上说，倒数是不精确的，除非D是二的幂。因此会涉及一些舍入误差。这+1您看到的就是纠正舍入误差的。

最常见的例子是除以 3：

N / 3 = (N * 0xaaaaaaab) >> 33

Where 0xaaaaaaab = 2^33 / 3 + 1.

这种方法将推广到其他除数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Assembly

Optimization

BitManipulation

Division

multiplication

使用乘法执行整数除法[重复] 的相关文章

str.find 怎么这么快？

我之前遇到过一个问题我在迭代字符串并使用切片时寻找子字符串原来这是一个really关于性能的坏主意 str find速度要快得多但我不明白为什么 import random import string import timeit Ge
按位移位（左移或右移）有什么作用以及它的用途是什么？

我见过运营商 gt gt and lt lt 在我看过的各种代码中我真正理解的都不是但我只是想知道它们实际上做了什么以及它们的一些实际用途是什么如果班次就像x 2 and x 2 与实际使用的真正区别是什么 and 运营商有性能差异
比较字符串结尾的最佳方法是使用 RIGHT、LIKE 还是其他？

我需要将字符串的结尾与存储过程中可能的结尾列表进行比较会被叫很多大概有10 15个候选结局此时仅使用代码的解决方案比创建专用于此的表更好类似的东西 IF ENDSWITH var foo OR ENDSWITH var bar O
我可以让 C++ 编译器在编译时实例化对象吗？

我正在编写一些代码其中包含大量相当简单的对象我希望它们在编译时创建我认为编译器能够做到这一点但我无法弄清楚如何做到 In C我可以执行以下操作 include
为什么 SSE 对齐读取 + 随机播放在某些 CPU 上比未对齐读取慢，而在其他 CPU 上则不然？

在尝试优化有限差分代码所需的未对齐读取时我更改了未对齐的负载如下所示 m128 pm1 mm loadu ps H k 1 进入这个对齐的读取随机播放代码 m128 p0 mm load ps H k m128 pm4 mm load
查找二维空间中圆内的所有点

我表示我的 2D 空间考虑一个窗口其中每个像素显示为 2D 数组中的一个单元格即 100x100 的窗口由相同维度的数组表示现在给定窗口中的一个点如果我画一个半径的圆r 我想找到该圆圈中的所有点我想我应该检查半径周围方形区域中的
如何使用 #pragma 在 G++ 中启用优化

我想在没有命令行参数的情况下启用 g 优化我知道 GCC 可以通过写来做到这一点 pragma GCC optimize 2 在我的代码中但它似乎在 G 中不起作用此页面可能有帮助 http gcc gnu org onlinedoc
汇编-符号标志和奇偶校验标志

我不明白什么时候设置标志标志什么时候设置奇偶校验据我所知符号标志表示运算结果的符号 0表示正数 1表示负数那么为什么在下一个代码中 mov al 5 sub al 124 SF为零结果是负数关于PF 为什么a和b中设置了PF a
scipy-optimize-minimize 不执行优化 - CONVERGENCE: NORM_OF_PROJECTED_GRADIENT_<=_PGTOL

我试图最小化定义如下的函数 utility decision decision risk cost 其中变量采用以下形式决策二进制数组风险浮点数数组成本常数我知道解决方案将采取以下形式决定 1如果风险 gt 阈值决定 0
取消的分支与常规分支有何不同？

特别是对于 SPARC Assembly 取消的分支与常规分支有何不同我一直认为当我需要填充分支指令的 nop 延迟槽时需要取消分支指令但是我认为我在这一部分上是不正确的因为您可以在不取消分支的情况下填充 nop 如果不采用分支
如何在汇编语言中换行打印多个字符串

我试图在汇编中的不同行上打印多个字符串但使用我的代码它只打印最后一个字符串我对汇编语言非常陌生所以请耐心等待 section text global start start mov edx len mov edx len1 mov
Visual Studio 2017 上的简单装配程序

386 model flat c stack 100h printf PROTO arg1 Ptr Byte data msg1 byte Hello World 0Ah 0 code main proc INVOKE printf ADD
尝试使用 x86 程序集 GNU GAS 在数组索引处赋值时出现错误

我在用x86GNU 与 GCC 的程序集并尝试实现相当于以下内容的程序集c c int x 10 x 0 5 但是当我尝试运行使用命令 a out 我的汇编代码如下第一次编译后gcc filename s 错误Segmentatio
在 x86-64 CPU 上通过交叉修改代码重现意外行为

Question 对于可能在 x86 或 x86 x64 系统上触发意外行为的交叉修改代码有哪些想法在这些系统中交叉修改代码中的所有操作均已正确完成但在执行处理器之前执行序列化指令除外修改代码如下所述我有一个 Core 2 Duo
用于预乘 ARGB 的 SSE alpha 混合

我正在尝试编写一个支持 SSE 的 alpha 合成器这就是我想出的首先混合两个 4 像素向量的代码 alpha blend two 128 bit 16 byte SSE vectors containing 4 pre multi
使用 Easy 68K (68000) 组装范围内的随机数

我正在使用 Easy 68K 模拟器创建一个简单的黑杰克游戏需要使用随机数来分配牌我的牌必须在 2 到 11 的范围内我似乎每次都得到相同的数字但它不在我预期的范围内我的卡值需要以 D3 结束因此我有以下随机数代码 CLR L
Nasm 打印到下一行

我用 nasm Assembly 编写了以下程序 section text global start start Input variables mov edx inLen mov ecx inMsg mov ebx 1 mov eax 4
68HC11计算sin(x)的汇编代码

68HC11 使用泰勒级数或查找表计算正弦值的汇编代码是什么显示值只能是整数查找表如何工作在这种情况下如何使用它来实现泰勒级数 http en wikipedia org wiki Taylor series 如果您正在寻找浮点解决
“rep stos”x86 汇编指令序列有什么作用？

我最近偶然发现了以下汇编指令序列 rep stos dword ptr edi For ecx重复存储内容eax到哪里edi指向递增或递减edi 取决于方向标志每次 4 个字节通常这用于memset型操作通常该指令简单地写成r
如何知道寄存器是否是“通用寄存器”？

我试图了解寄存器必须具备什么标准才能被称为通用寄存器我相信通用寄存器是一个可以用于任何用途的寄存器用于计算将数据移入移出等并且是一个没有特殊用途的寄存器现在我读到了ESP寄存器是通用寄存器我猜是ESP寄存器可以用于任何事情

随机推荐

使用 LLVM 为整个源代码生成 CFG

LLVM 社区的任何人都知道是否有一种方法可以使用以下方法为整个输入源代码生成 CFG opt dot cfg foo ll bc 由于此函数为每个函数生成 CFG 因此函数之间的连接将被忽略看来旧的分析工具已经贬值了我想知道你是否找到
使用 highcharts 在堆栈标签中显示特定系列值

这是我正在处理的内容 http jsfiddle net josip0423 prJjY 171 http jsfiddle net josip0423 prJjY 171 过去几个小时我一直在努力解决这个问题但一无所获我对 javas
C# 异步操作

实际上我很难理解 BeginInvoke 和 EndInvoke 对 class AsynchronousDemo public delegate void DemoDelegate static void Main DemoDelegat
glGenerateMipmap 是否在 sRGB 纹理的线性空间中执行平均？

OpenGL 3 3 规范似乎没有要求 mipmap 生成在线性空间中完成我能找到的只有以下内容派生的 mipmap 数组的内部格式都与 levelbase 数组和派生数组的维度如下第 3 8 14 节中描述的要求的内容派生数组是
GPS 坐标（以度为单位）来计算距离

在iPhone上我以十进制度数获取用户的位置例如纬度39 470920和经度 0 373192 也就是A点我需要用另一个 GPS 坐标同样以十进制表示 B 点创建一条线然后计算从 A 到 B 的线与另一个点 C 之间的距离垂
在用 Kotlin 编写的 Android 库的公共 API 中处理 R8 + JvmStatic Annotation + Lambda

首先请注意我并不期待why do you want to obfuscate library评论这是我要问的一个真正的问题我在使用 Kotlin 编写的 Android 库处理 R8 混淆时遇到了问题我有一个公共 API 方法其注
使用 C# 不使用 xslt 将 XML 转换为 CSV

我一直在网上搜索我假设有人必须在我之前需要这个并且做得更好以获取 xml 到 csv 转换器我有一个非常标准的 xml 如下
IE7 大纲：0 不工作

我知道大纲是用于可访问性的但还有另一种方法 a outline 0 可以在 IE7 中运行的东西也许使用 Jquery 对于 jquery 你可以尝试这样的事情 a focus function this blur 它本质上与 IE 7
决定要 #include 哪些标准头文件

假设我正在编辑一些大型 C 源文件并且我添加了几行碰巧使用的代码auto ptr 如下例所示 include
c中前缀和后缀的优先级和结合性

int main char arr geeksforgeeks char ptr arr while ptr 0 ptr printf s s arr ptr getchar return 0 while循环内的语句 ptr 我不明白的行为
SSE，行主要与列主要性能问题

出于个人和娱乐目的我正在使用 SSE 4 1 编写一个 geom 库我花了最后 12 个小时试图理解处理行主要与列主要存储矩阵时的性能问题我知道 Dirext OpenGL 矩阵是以行主顺序存储的因此对我来说将矩阵按行主顺序存储会
Android Http 获取会话 Cookie

我本来不想在这里发帖因为网上有太多信息但我已经深入搜寻但无法弄清楚好吧所以我无法让它在两种情况下工作希望这两种情况的答案是相同的我的问题是我设置了请求标头但它似乎没有发送它我有一个会话 id s e32ff223fwefd3
从片段访问父活动的数据

从活动的片段访问活动的数据成员的最佳方法是什么我知道的一些方法包括在 Activity 将实现的 Fragment 中创建一个接口该接口将具有访问活动数据成员的方法直接使用片段中的 Activity getActivity getX
jQuery：触发器不会在使用 .load() 加载的元素上触发

我有index php 并使用jQuery load 从load php 加载内容当我在 index php 中的元素上触发事件时该事件将触发在相同的元素上当使用 load 加载到 index php 时事件不会触发为什么我做
设置 CRS 以使用雄蕊图进行绘图

我试图在地图上绘制一个简单的多边形来表示我感兴趣的区域迄今为止我已将多边形定义为并且能够单独绘制它 poly lt st polygon list as matrix data frame lat c 40 40 60 60 40 lo
Jasmine 测试在 Chrome 和 Firefox 中通过，但在 PhantomJS 中失败

我正在使用 React 构建一个基本的博客应用程序我正在使用 Jasmine 和 Karma 来运行我的前端测试我启动并运行了第一个测试它在 Chrome Chromium 和 Firefox 中通过但是当它在 PhantomJS
如何将添加到 TextBox c#？或者如何将动态字符串附加到 TextBox 中的静态字符串？

在 WPF 中我知道对于 TextBlock 当我想将一些动态字符串附加到字符串时我可以执行如下操作
SBT、依赖项、类路径和编辑器

我最近将 sbt 设置更新到版本 0 11 如您所知新的 SBT 使用 ivy2 文件夹来存储缓存所有检索到的 jar 文件我正在使用 IntelliJ 我想知道将依赖项导入编辑器类路径的推荐方法是什么一种选择是手动访问 ivy2
呈现模式视图控制器后将 BarButtons 添加到 UINavigationBar

我正在使用实用程序应用程序的模板在 FlipSideViewController 中我为 UINavigationController navController 添加了 IBOutlet 在代码中我添加了 navController
使用乘法执行整数除法[重复]

这个问题在这里已经有答案了查看编译器生成的 x86 程序集我注意到无符号整数除法有时会实现为整数乘法这些优化似乎遵循以下形式 value n gt value 0xFFFFFFFF n 1 0x100000000 例如除以 9

使用乘法执行整数除法[重复]

使用乘法执行整数除法[重复] 的相关文章

随机推荐

热门标签