计算整数上的位 1 的速度与 GCC builtinpopcount(int) 一样快

2023-11-27

我编写了一个算法（摘自“C 编程语言”），可以非常快地计算 1 位的数量：

int countBit1Fast(int n)
{
    int c = 0;
    for (; n; ++c)
        n &= n - 1;
    return c;
}

但一位朋友告诉我__builtin__popcount(int)速度快很多，但便携性较差。我尝试了一下，速度快了很多倍！为什么这么快？我想尽可能快地计算位数，但不拘泥于特定的编译器。

EDIT:我可能会在 PIC 微控制器上使用它，也可能在非英特尔处理器上使用它，所以我需要最大的可移植性。

我编写了一个算法（摘自“C 编程语言”），可以非常快地计算 1 位的数量：

我不明白为什么有人会把你的方法描述为“非常快”。它有点聪明，而且平均来说应该比简单的替代方案更快。它也不依赖于表示的宽度int，这是一个优点。我观察到它对负参数有未定义的行为，但这是按位运算符和函数的常见主题。

让我们分析一下，假设有一个非负参数：

int c = 0;
for (; n; ++c)
    n &= n - 1;

执行了多少次循环迭代？

1 表示值的二进制表示形式中的每 1 位，无论where在每一位所在的值中
每次迭代执行多少工作
- 一个增量c
- 的一项比较n反对零（当打破循环时再加上一个）
- 减一n by 1
- 一个按位“和”
这忽略了读取和存储，通过将操作数保存在寄存器中，这很可能可以免费或特别便宜。如果我们假设每个操作的成本相同，则每次迭代有四次操作。对于随机 32 位整数，平均迭代 16 次，总共平均 65 次操作。（最好的情况只是一次操作，但最坏的情况是 129，这并不比简单的实现更好）。

__builtin_popcount()，另一方面，使用一条指令无论支持它的平台上的输入如何，例如您的平台很可能都是如此。然而，即使对于那些没有专用指令的人来说，也可以更快地完成（平均而言）。

@dbush 提出了一种这样的机制，它与您提出的机制具有类似的优点。特别是，它不依赖于预先选择的整数宽度，尽管它确实依赖于where在 1 位驻留在表示中，对于某些参数（较小的参数），它确实比其他参数运行得更快。如果我数对了，那一个就平均了约20次操作在随机 32 位输入上：四次循环迭代中每一次迭代五次（只有 0.4% 的随机输入需要少于四次迭代）。我正在计算每次迭代读取的一个表，我假设可以从缓存中提供该表，但这可能仍然不如对寄存器中已保存的值进行算术运算快。

严格计算的一种是：

int countBit1Fast(uint32_t n) {
    n = (n & 0x55555555u) + ((n >> 1) & 0x55555555u);
    n = (n & 0x33333333u) + ((n >> 2) & 0x33333333u);
    n = (n & 0x0f0f0f0fu) + ((n >> 4) & 0x0f0f0f0fu);
    n = (n & 0x00ff00ffu) + ((n >> 8) & 0x00ff00ffu);
    n = (n & 0x0000ffffu) + ((n >>16) & 0x0000ffffu);
    return n;
}

这很容易计算：五次加法、五次移位、十次按位“与”运算，以及 5 次常量加载，总共25 次操作对于每个输入（对于 64 位输入，它只增加到 30，尽管这些现在是 64 位操作而不是 32 位操作）。然而，该版本本质上取决于输入数据类型的特定大小。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

计算整数上的位 1 的速度与 GCC builtinpopcount(int) 一样快的相关文章

静态构造函数和 BeforeFieldInit？

如果类型没有静态构造函数则将执行字段初始值设定项就在使用该类型之前或者在某个时间点突发奇想运行时为什么这段代码 void Main start Dump Test EchoAndReturn Hello end Dump clas
捕获 .aspx 和 .ascx 页面中的异常

问题说明了一切请看以下示例代码 ul li li ul
在 C 语言中，为什么数组的地址等于它的值？

在下面的代码中指针值和指针地址与预期不同但数组值和地址则不然怎么会这样 Output my array 0022FF00 my array 0022FF00 pointer to array 0022FF00 pointer to a
Boost ASIO 串行写入十六进制值

我正在使用 ubuntu 通过串行端口与设备进行通信所有消息都必须是十六进制值我已经在 Windows 环境中使用白蚁测试了通信设置并得到了我期望的响应但在使用 Boost asio 时我无法得到任何响应以下是我设置串口的方法 b
使用 C# 和 ASP.NET 在电子邮件附件中发送 SQL 报告

我正在尝试使用 ASP NET 和 C 从 sql reportserver 2008 作为电子邮件附件发送报告到目前为止我学会了如何获取 PDF 格式的报告 http weblogs asp net srkirkland archive
MVC 5 中具有 ASP.NET Identity 的 Autofac 不会验证 OWIN 管道中的安全标记

我在 MVC 5 中设置了 AutoFac 来与 ASP NET Identity 一起使用表面上一切似乎都工作正常即用户可以创建帐户并登录但后来我发现当安全标记更改时用户不会注销通过在 AspNetUsers 表中进行暴力破解
用于在标头更改时重新编译的简单 C 项目的示例 makefile

有谁有完整的 makefile 可以执行以下操作如果 HEADER 文件发生更改则重建项目 cpp 文件在 makefile 中列出头文件未在 makefile 中列出头文件允许与 cpp 文件具有不同的名称部分cpp文件没有头文
为什么这个 makefile 在“make clean”上执行目标

这是我当前的 makefile CXX g CXXFLAGS Wall O3 LDFLAGS TARGET testcpp SRCS main cpp object cpp foo cpp OBJS SRCS cpp o DEPS SRCS
Libev，如何将参数传递给相关回调

我陷入了 libev 中争论的境地通常 libev 在类似的函数中接收包接收回调没关系但是实际操作中我们需要派遣一个亲戚写回调根据收到的包裹处理具体工作例如 S RECV MSG pstRecvMsg S RECV MSG
wordexp 失败时我们需要调用 wordfree 吗？

wordexp 失败时我们需要调用 wordfree 吗在某些情况下调用 wordfree 似乎会出现段错误例如当 wordfree 返回字符串为 foo bar 的错误代码时这在手册页中并不清楚我已经看到在某些错误情况下使用了
在 azure blob 存储中就地创建 zip 文件

我将文件存储在 Blob 存储帐户内的一个容器中我需要在第二个容器中创建一个 zip 文件其中包含第一个容器中的文件我有一个使用辅助角色和 DotNetZip 工作的解决方案但由于 zip 文件的大小最终可能达到 1GB 我担心在进
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
MySQL 连接器 C++ 64 位在 Visual Studio 2012 中从源代码构建

我正在尝试建立mySQL 连接器 C 从源头在视觉工作室2012为了64 bit建筑学我知道这取决于一些boost头文件和C 连接器跑步CMake生成一个项目文件但该项目文件无法编译因为有一大堆非常令人困惑的错误这些错误可能与包含
Xamarin Forms Binding - 访问父属性

我无法访问页面的 ViewModel 属性以便将其绑定到 IsVisible 属性如果我不设置 BindingContext 我只能绑定它有没有办法可以在设置 BindingContext 的同时访问页面的 viewmodel root
在哪里可以找到 Microsoft.Build.Utilities.v3.5

如何获取 Microsoft Build Utilities v3 5 我正在使用 StyleCop 4 7 Stylecop dll 中的 StyleCop msbuild 任务似乎依赖于 Microsoft Build Utilitie
调用 .ToArray() 时出现 ArgumentException

我有一个经常被清除的列表代码完全是这样的 VisitorAgent toPersist List
如何在C#中控制datagridview光标移动

我希望 datagridview 光标向右移动到下一列而不是在向单元格输入数据后移动到下一行我试图通过 dataGridView1 KeyDown 事件捕获键来控制光标但这并不能阻止光标在将数据输入到单元格后移动到下一行提前感谢你的
构建 C# MVC 5 站点时项目之间的处理器架构不匹配

我收到的错误如下 2017 年 4 月 20 日构建 13 23 38 C Windows Microsoft NET Framework v4 0 30319 Microsoft Common targets 1605 5 警告 MSB3
如果找不到指定的图像文件，显示默认图像的最佳方式？

我有一个普通的电子商务应用程序我将 ITEM IMAGE NAME 存储在数据库中有时经理会拼错图像名称为了避免丢失图像 IE 中的红色 X 每次显示产品列表时我都会检查服务器中是否有与该产品相关的图像如果该文件不存在我会将其
嵌入式linux编写AT命令

我在向 GSM 模块写入 AT 命令时遇到问题当我使用 minicom b 115200 D dev ttySP0 term vt100 时它工作完美但我不知道如何在 C 代码中做同样的事情我没有收到任何错误但模块对命令没有反应有

随机推荐

如何通过电子邮件将我正在开发的 Android 应用程序发送给某人？

这是我的第一个 Android 应用程序我需要将迄今为止的内容通过电子邮件发送给某人进行测试我应该如何导出应用程序并附加它以免它被视为垃圾更简单的方法将 apk 放在您的网络服务器上使用以下命令创建 QR 条形码图像然后通过电
为什么 CAP 定理中的 C 与 ACID 中的 C 不同？

我的问题很简单正在寻找一个更简单的答案为什么 CAP 定理中的 C 与 ACID 中的 C 不同 Read thisHN 螺纹 Update NOSQL v1 0 搭便车指南幻灯片 71 说 CAP 中的 C A C 原子一致性两个
跟踪数据库模式更改的机制[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导跟踪和或自动化数据库架构
计算两个 Pandas 列之间的时间差（以小时和分钟为单位）

我有两列 fromdate and todate 在数据框中 import pandas as pd data todate pd Timestamp 2014 01 24 13 03 12 050000 pd Timestamp 2014
将 std::experimental::filesystem 与 Xcode 9 链接

我正在使用 std experimental filesystem 和 Xcode 9 0 beta 编译器阶段完成正常但链接器抱怨未定义的符号 std experimental filesystem v1 path filename c
创建大量线程时出现.Net 内存泄漏

我有一个随着时间的推移创建大量线程的应用程序我注意到内存使用量随着它的运行而增加并最终耗尽内存但相同的代码在我同事的环境中不会泄漏内存我们都有相同的 net 版本我能够使用以下示例代码重现该问题该代码不会在我同事的笔记本电脑上泄
为什么最好从方法类的实例中静态调用静态方法？

如果我在 Java 中创建类的实例为什么最好静态调用同一类的静态方法而不是使用 this method 当我尝试通过 this staticMethod 从自定义类的构造函数中调用静态方法 staticMethod 时我收到来自 Ec
获取客户端当前在断开连接事件中所在的房间列表

我正在尝试查找客户端当前在断开连接事件中所在的房间列表关闭浏览器重新加载页面互联网连接已断开我需要它的原因如下用户已进入几个房间然后其他人也做了同样的事情然后他关闭了浏览器选项卡我想通知他所在房间里的所有人他离开了所以我需
pyside qtreewidget 约束拖放

我试图向 QTreeWidget 拖放功能添加约束以防止分支进入另一个根中的另一个分支这是一个让事情更清楚的例子我有 4 个对象我们称它们为苹果香蕉胡萝卜榴莲这棵树看起来像这样 isDelicious Root Backgr
Xcode 11.4 beta 在 @Published 属性订阅上崩溃。这是怎么回事？

我不知道为什么但我的代码在这个 searchTerm 发布者上崩溃了我的代码中有很多这样的发布者其他一切都正常它仅在这个新的 Xcode 版本中不起作用而在以前的版本中起作用如果我评论这一行并将其替换为 searchTerm p
将信息从 javascript 传递到 django 应用程序并返回

所以我试图基本上建立一个网页用户在其中选择一个id 然后该网页将id信息发送到python 其中python使用该id来查询数据库然后将结果返回到网页进行显示我不太确定该怎么做我知道如何使用 ajax 调用来调用 python 生成
C# FlowDocument 到 HTML 的转换

基本上我有一个 RichTextBox 我想将其格式化内容转换为 HTML 以便它可以作为电子邮件发送我当前使用的方法根本不提供任何格式 string message new TextRange messageTextBox Docum
插入大文件时出现“ORA-03135: 连接失去联系”

我正在尝试使用实体框架 ODP Net 将可能大量的二进制数据插入到远程 Oracle 11g 数据库中它对于非常小的文件我不认为它超时因为异常发生在执行命令的一秒钟内我尝试在连接字符串中设置以下两项但无济于事 Validate
是否可以通过模式切换在64位进程中执行32位代码？

在这个页面中 http www x86 64 org pipermail discuss 2004 August 005020 html他说有一种方法可以在应用程序中混合 32 位代码和 64 位代码他假设应用程序是 32 位兼容模式
哪个 STL C++ 容器用于固定大小的列表？

我有一个消费应用程序它需要在列表中存储最多 100 个对象以提供给回调进行处理因为如果消费者没有跟上保留旧数据将是多余的当新数据到达时它可以简单地覆盖最旧的元素我正在考虑使用循环缓冲区容器并猜测它会是 deque 但发现它不使
Git-archive远程端挂了

我试图从 Github 上签出单个文件关注后 this我尝试过的线程 git archive format tar remote ssh email protected user project git HEAD README md 我收
如何获取“somepage.php#name”中哈希后的值？

对于给定的网址我想从数据库中获取哈希后名称的年龄所以对于像这样的网址thepage php Madonna 你会看到的 119 如何提取 url 中哈希值后的值我需要一种安全的全浏览器兼容的非 JavaScript 方式我想像 GE
Android Studio 的 Structure 侧边栏中的不同图标和符号代表什么意思？

当我单击 Android Studio 中的结构侧边栏时它会显示当前类的内容然而有一些图标和符号用于指示不同的成员例如带有字母 m 的圆圈表示方法等在哪里可以获得所有图标和符号的完整列表和详细信息我正在寻找类似解释各种图标
会话在每个 servlet 请求中丢失并创建为新会话

我有这个大问题每次我向服务器发出新请求时我当前的会话都会消失我查过很多地方我找不到问题所在我还包括了 tomcat 和应用程序中 web xml 中的 session config 我还启用了我的浏览器接受 cookie 在每个浏
计算整数上的位 1 的速度与 GCC __builtin__popcount(int) 一样快

我编写了一个算法摘自 C 编程语言可以非常快地计算 1 位的数量 int countBit1Fast int n int c 0 for n c n n 1 return c 但一位朋友告诉我 builtin popcount int

计算整数上的位 1 的速度与 GCC __builtin__popcount(int) 一样快

计算整数上的位 1 的速度与 GCC __builtin__popcount(int) 一样快 的相关文章

随机推荐

热门标签

计算整数上的位 1 的速度与 GCC builtinpopcount(int) 一样快

计算整数上的位 1 的速度与 GCC builtinpopcount(int) 一样快的相关文章