计算位数的最快方法[重复]

2024-01-11

可能的重复：
如何计算 32 位整数中设置的位数？ https://stackoverflow.com/questions/109023/how-to-count-the-number-of-set-bits-in-a-32-bit-integer

给出一个unsigned char类型值，计算其中的总位数。最快的方法是什么？我写了如下三个函数，最好的方法是什么，有人能想出一个更快的函数吗？（我只想要极快的函数）

const int tbl[] =
{
#define B2(n)   n, n+1, n+1, n+2
#define B4(n) B2(n), B2(n+1), B2(n+1), B2(n+2)
#define B6(n) B4(n), B4(n+1), B4(n+1), B4(n+2)
    B6(0), B6(1), B6(1), B6(2)
};

char naivecount (unsigned char val)
{
    char cnt = 0;
    while (val)
    {
        cnt += (val & 1);
        val = val >> 1;
    }
    return cnt;
}

inline tableLookUp(int val)
{
    assert(val >= 0 && val <= 255);
    return tbl[val];
}

int asmCount(int val)
{
    int res = 0;
    asm volatile("xor %0, %0\n\t"
            "begin:\n\t"
            "cmp $0x0, %1\n\t"
            "jle end\n\t"
            "movl %1, %%ecx\n\t"
            "and $0x1, %%ecx\n\t"
            "addl %%ecx, %0\n\t"
            "shrl %1\n\t"
            "jmp begin\n\t"
            "end:"
            : "=r"(res)
            : "r" (val));
    return res;
}

EDIT:

我已经测试了所有方法，最快的一种是使用popcntl指令。在没有指令的平台上，我将使用查表。

如果您想手动编码，请尝试以下操作：

#include <stdint.h>

int popcnt8(uint8_t x) {

    x = (x & 0x55) + (x >> 1 & 0x55);
    x = (x & 0x33) + (x >> 2 & 0x33);
    x = (x & 0x0f) + (x >> 4 & 0x0f);

    return x;
}

在 x86 上，编译为（AT&T 语法）：

popcnt8:
    movl    %edi, %eax
    shrb    %dil
    andl    $85, %eax
    andl    $85, %edi
    addl    %eax, %edi
    movl    %edi, %eax
    shrb    $2, %dil
    andl    $51, %eax
    andl    $51, %edi
    addl    %eax, %edi
    movl    %edi, %eax
    shrb    $4, %dil
    andl    $15, %eax
    addl    %edi, %eax
    movzbl  %al, %eax
    ret

将其与 gcc 使用内在函数生成的内容进行比较：

#include <stdint.h>

int popcnt8_intrin(uint8_t x) { return __builtin_popcount(x); }

在具有 SSE 4.2 的 x86 上：

popcnt8_intrin:
movzbl  %dil, %eax
popcntl %eax, %eax
ret

这不是最佳的； clang 生成：

popcnt8_intrin:
    popcntl %edi,%eax
    ret

将计算减少到一条（！）指令。

在没有 SSE 4.2 的 x86 上：

popcnt8_intrin:
subq    $8, %rsp
movzbl  %dil, %edi
call    __popcountdi2
addq    $8, %rsp
ret

gcc 本质上是在这里调用它的库。不太理想。 clang 做得更好一些：

popcnt8_intrin:                         # @popcnt8_intrin
movl    %edi, %eax
shrl    %eax
andl    $85, %eax
subl    %eax, %edi
movl    %edi, %eax
andl    $858993459, %eax        # imm = 0x33333333
shrl    $2, %edi
andl    $858993459, %edi        # imm = 0x33333333
addl    %eax, %edi
movl    %edi, %eax
shrl    $4, %eax
addl    %edi, %eax
andl    $252645135, %eax        # imm = 0xF0F0F0F
imull   $16843009, %eax, %eax   # imm = 0x1010101
shrl    $24, %eax
ret

clang 计算整个 32 位数字的 popcnt。恕我直言，这不是最佳的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Assembly

计算位数的最快方法[重复] 的相关文章

json.net自定义jobject反序列化

我正在尝试使用 JsonConvert DeserializeObject string 将字符串反序列化为可与动态一起使用的 jobject 来动态访问 json 文档但是我想避免知道文档的大小写以便我可以输入 dynamic doc
为什么 F# 的默认集合是排序的，而 C# 的不是？

当从 C 世界迁移到 F 最惯用的可能思维方式时我发现了这个有趣的差异在 C 的 OOP mutable 世界中默认的集合集合似乎是HashSet https learn microsoft com en us dotnet api
删除是如何工作的？ [复制]

这个问题在这里已经有答案了可能的重复 C 编程 free 如何知道要释放多少 https stackoverflow com questions 1518711 c programming how does free know how m
检测wlan是否关闭

任何人都可以给我一个提示如何在 Windows Phone 上以编程方式检测 C 8 1 应用程序不是 8 0 是否启用禁用 WLAN 我不想更改这些设置只是需要知道该解决方案是一个 Windows 8 1 通用应用程序 Wind
将完整模板参数值映射到原始类型

我想将数字映射到类型在这个例子中我将创建一个函数将 sizeof 结果映射到有符号的原始类型我想知道是否有更好的方法来完成我在现代 C 中所做的事情即采用模板化值并将其转换为类型现在这可以将大小转换为已知类型但我似乎无法在标
解析 JWT 令牌以仅获取有效负载内容，无需 C# 或 Blazor 中的外部库

我正在使用 Blazor 编写可以访问 JWT 的客户端应用程序我想知道一种简单的方法来读取令牌有效负载内容而不添加额外的依赖项因为我不需要其他信息也不需要验证令牌我认为解析有效负载内容应该足够简单只需将其写入方法即可 JwtTo
std::call_once 可重入且线程安全吗？

std call once http en cppreference com w cpp thread call once是线程安全的但它也是可重入的吗我使用 VS2012 调试和发布进行的测试表明调用std call once从单
运行需要 MySql.Data 的内置 .NET 应用程序

我在运行我编写的内置 NET 应用程序时遇到问题我的应用程序使用最新的 MySql 连接器该连接器安装在我的系统上当我尝试将其添加为引用时该连接器显示为 NET 4 Framwork 组件当我在环境中以调试模式运行应用程序时一切
是否存在指向不同类型的指针具有不同大小的平台？

C 标准允许指向不同类型的指针具有不同的大小例如sizeof char sizeof int 是允许的但是它确实要求如果将指针转换为void 然后转换回其原始类型它必须与其原始值进行比较因此从逻辑上来说 sizeof void
在开关中使用“goto”？

我看到了一个建议的编码标准内容如下Never use goto unless in a switch statement fall through 我不跟这个例外案例到底是什么样的这证明了goto 此构造在 C 中是非法的 swi
如何制作可启动程序？

所以这个问题可能看起来很奇怪但假设我编译了 int main void int x 3 int y 4 int z x y 是否可以让CPU这样运行如何例如这允许我写入监视器吗如果我没记错的话内存中有些地方可以写入要显示的内容
为什么 VC++ 编译器 MOV+PUSH args 而不是仅仅 PUSH 它们？ x86

在 VC 的反汇编中正在进行函数调用编译器在压入本地指针之前将其 MOV 到寄存器 memcpy nodeNewLocation pNode sizeCurrentNode 0041A5DA 8B 45 F8 mov eax dword
如何对 NServiceBus.Configure.WithWeb() 进行单元测试？

我正在构建一个 WCF 服务该服务接收外部 IP 上的请求并将其转换为通过 NServiceBus 发送的消息我的单元测试之一调用Global Application Start 它执行应用程序的配置然后尝试将 Web 服务解析为验
析构函数中的异步操作

尝试在类析构函数中运行异步操作失败这是代码 public class Executor public static void Main var c1 new Class1 c1 DoSomething public class Class
在 asp.net MVC 中使用活动目录进行身份验证

我想使用活动目录对我的 asp net mvc 项目中的用户进行身份验证在网上冲浪了几个小时后我没有找到任何对我有用的东西我已经看到了所有结果但什么也没有我尝试按照许多帖子的建议编辑我的 web config 如果有人可以帮助我提
英文日期差异

接近重复如何计算相对时间 https stackoverflow com questions 11 how do i calculate relative time 如何在 C 中计算某人的年龄 https stackoverflow c
从浏览器访问本地文件？

您好我想从浏览器访问系统的本地文件由于涉及大量安全检查是否可以通过某种方式实现这一目标或使用 ActiveX 或 Java Applet 的任何其他工作环境请帮帮我要通过浏览器访问本地文件您可以使用签名的 Java Apple
如何在 winforms 应用程序的主屏幕显示之前显示欢迎屏幕？

我想在应用程序启动时加载欢迎屏幕然后用户单击欢迎屏幕上的按钮然后关闭欢迎屏幕最后显示主屏幕 static void Main startup method being called Application EnableVisualSt
为什么以下 C 程序会出现总线错误？

我认为这是第一个失败的 strtok 调用好久没写C了有点不知所措非常感谢 include
结构化绑定的用例有哪些？

C 17 标准引入了新的结构化绑定 http en cppreference com w cpp language structured binding功能最初是proposed http www open std org jtc1 sc

随机推荐

Chrome Incognito 中不会触发 onbeforeunload 事件

我一直在尝试发送信标beforeunload它似乎适用于几乎所有现代浏览器除了隐身模式下的 Chrome 这是适用于所有现代浏览器的代码除了 Chrome 的隐身模式 window onbeforeunload function nav
phantomjs 不支持 windows 机器上的 flash 播放器

我正在开发一个 python 脚本来从许多网站获取屏幕截图为此我使用以下工具带有硒的 phantomjsPython视窗电脑我已经使用 pyside 而不是 phantomjs 来完成这项工作但我在 pyside 上遇到了很多问题
如何将 Ctrl/Shift/Alt + 组合键发送到应用程序窗口？（通过发送消息）

I can successfully send any single key message to an application but I don t know how to send combinations of keys like
如何在 yii2 中刷新 pjax listview？它重新加载整个页面

我希望能够刷新 pjax 列表视图而不刷新整个页面这是 pjax 列表本身的视图
preg_match 特殊字符

我该如何使用preg match查看是否有特殊字符 gt lt gt 存在于字符串中吗 W 将匹配任何非单词字符但要仅匹配问题中的字符请使用以下命令 string sadw if preg match gt lt gt string t
如何使用 Spring Data MongoDB 通过 GridFS ObjectId 获取二进制流

我不知道如何使用 spring data mongodb 及其从 GridFS 流式传输二进制文件GridFSTemplate当我已经拥有权利的时候ObjectId GridFSTemplate 返回GridFSResource getRe
最小生成树的前序遍历

有没有办法打印MST给出的输出的前序遍历使用Kruskal或Prim的算法我很困惑因为输出可能总是或不是二叉树那么这里的预序遍历是如何实现的呢普通的DFS可以完成这个任务吗处理此类问题时的主要问题是该词的歧义tree在算法问题
使用 C# 匿名类型

我正在调用一个返回包含 c 匿名类型对象的 List 变量的方法例如 List list new List foreach Contact c in allContacts list Add new ContactID c Contact
在 C 编程中，如何将两个头文件和 3 个 c 文件链接到一个可执行文件中？

我被要求创建两个头文件 h1 h 和 h2 h 两个c文件 a1 c和a2 c 和一个主文件 mainfile c a1 文件包含 h1 头文件 a2 包含 h2 头文件 mainfile 包含这两个头文件现在我想将它们链接在一起以获得一
Gnu C++ 宏 __cplusplus 标准符合吗？

Gnu C 编译器似乎定义了 cplusplus to be 1 include
如何设置核心数据xcdatamodel中UUID属性的默认值

如何设置核心数据xcdatamodel中UUID属性的默认值如果我将属性设置为非可选则需要默认值在代码中我使用 UUID 设置它来分配值但这在 xcdatamodel 中不起作用没有必要在模型中分配默认值在类中覆盖awakeF
如何在图表 API x/y 轴标签中仅显示整数（无小数）

我正在使用带有 Google Chart JS Api 的柱形图我正在显示一些只能表示为整数的值按天计算的总订单数一切都运行良好除了当我显示的其中一个图表的值太低例如 1 或 2 时它开始在 y 轴上显示小数小数看起来很愚蠢
Socket.io 未向所有连接的套接字发送消息

我正在尝试node js 和socket io 我不想使用删除 ping 功能我必须从服务器获取更新这是我正在做的事情的示例代码 var app require http createServer io require socket i
将 N 个模式中的所有表中的数据从 db2 导出到带有列名的 CSV 中

我正在尝试将一堆带有列名称的 DB2 表导出到 CSV 我没有看到任何直接的方法来做到这一点我跟着this https stackoverflow com questions 10122505 export data from db2 w
有什么方法可以让 Meteor 中的简单模式验证特定的数组索引吗？

根据我在文档中的理解您可以像这样定义您的架构 MySchema new SimpleSchema This says that the addresses key is going to contain an array addresse
使用 Moq 和 MSTest 测试异常的正确方法

Moq 与 MsTest 的行为有点混乱编辑这不是我如何测试的问题或我如何断言这是一个草稿本用于了解 MoQ 如何工作因此不要关注异常类型等我认为更好的问题可能是 gt Moq Throws 的行为是否与 MsTest
将对象创建转移到另一个方法后出现 JNI 总线错误

我有一个 JNI 问题花了我一整天的时间如果我不寻求帮助可能会让我发疯用两句话来说我从 JNI 方法调用 NewObject 并且它工作正常但是当我将此代码移至另一个方法时它崩溃了更多细节我有这个简单的类我想从 JNI
jupyter笔记本中删除后释放内存

我已经使用删除了 jupyter 笔记本中的一些变量del list of df 但我们意识到内容仍然占用内存所以我们尝试了 reset list of df 但是之前的变量名已经不存在了难道只能重启内核来回收内存吗谢谢更远更一般
Jenkinsfile 是纯 Groovy 中的吗？ Jenkinsfile 的“steps”中使用什么 Groovy 语言结构？

Jenkinsfile 中的以下代码片段使用了什么 Groovy 语言构造语法或控制结构 stage Stage 1 steps One or more steps 即就纯 Groovy 语言而言 Jenkinsfile 中的块是什么
计算位数的最快方法[重复]

这个问题在这里已经有答案了可能的重复如何计算 32 位整数中设置的位数 https stackoverflow com questions 109023 how to count the number of set bits in a

计算位数的最快方法[重复]

EDIT:

计算位数的最快方法[重复] 的相关文章

随机推荐

热门标签