DJB 哈希函数中数字 5381 的原因是什么？

2024-04-11

谁能告诉我为什么 DJB 哈希函数中使用数字 5381？

DJB 哈希函数定义为：

h₀ = 5381
h_i = 33h_{i - 1} + s_i

这是一个 C 实现：

unsigned int DJBHash(char* str, unsigned int len)
{
   unsigned int hash = 5381;
   unsigned int i    = 0;

   for(i = 0; i < len; str++, i++)
   {   
      hash = ((hash << 5) + hash) + (*str);
   }   

   return hash;
}

我偶然发现了一个comment https://gist.github.com/1676398这让我们对 DJB 的所作所为有了一些了解：

/*
* DJBX33A (Daniel J. Bernstein, Times 33 with Addition)
*
* This is Daniel J. Bernstein's popular `times 33' hash function as
* posted by him years ago on comp.lang.c. It basically uses a function
* like ``hash(i) = hash(i-1) * 33 + str[i]''. This is one of the best
* known hash functions for strings. Because it is both computed very
* fast and distributes very well.
*
* The magic of number 33, i.e. why it works better than many other
* constants, prime or not, has never been adequately explained by
* anyone. So I try an explanation: if one experimentally tests all
* multipliers between 1 and 256 (as RSE did now) one detects that even
* numbers are not useable at all. The remaining 128 odd numbers
* (except for the number 1) work more or less all equally well. They
* all distribute in an acceptable way and this way fill a hash table
* with an average percent of approx. 86%.
*
* If one compares the Chi^2 values of the variants, the number 33 not
* even has the best value. But the number 33 and a few other equally
* good numbers like 17, 31, 63, 127 and 129 have nevertheless a great
* advantage to the remaining numbers in the large set of possible
* multipliers: their multiply operation can be replaced by a faster
* operation based on just one shift plus either a single addition
* or subtraction operation. And because a hash function has to both
* distribute good _and_ has to be very fast to compute, those few
* numbers should be preferred and seems to be the reason why Daniel J.
* Bernstein also preferred it.
*
*
* -- Ralf S. Engelschall <[email protected] /cdn-cgi/l/email-protection>
*/

这是一个与您正在查看的哈希函数略有不同的哈希函数，尽管它确实使用了 5381 幻数。链接目标处的注释下方的代码已展开。

然后我发现this http://www.cnblogs.com/napoleon_liu/articles/1911571.html:

Magic Constant 5381:

  1. odd number

  2. prime number

  3. deficient number

  4. 001/010/100/000/101 b

还有this https://stackoverflow.com/a/2854205/63474回答有人可以解释 djb2 哈希函数背后的逻辑吗？ https://stackoverflow.com/questions/1579721/can-anybody-explain-the-logic-behind-djb2-hash-funcition它引用了一个post http://groups.google.com/group/comp.lang.c/browse_thread/thread/9522965e2b8d3809由 DJB 本人发送至提到 5381 的邮件列表（摘自此处摘录的答案）：

[...]几乎任何好的乘数都有效。我觉得你很担心关于 31c + d 不涵盖任何合理的哈希范围这一事实如果 c 和 d 的值在 0 到 255 之间。这就是为什么，当我发现 33 哈希函数并开始在我的压缩机中使用它，我开始哈希值为 5381。我想你会发现这就像以及 261 乘法器。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

Hash

primes

DJB 哈希函数中数字 5381 的原因是什么？的相关文章

在 O(nloglogn) 最坏情况时间内对具有 O(logn) 个不同元素的 n 元素数组进行排序

目前的问题是标题本身的内容即给出一种算法该算法在 O log logn 最坏情况时间内对具有 O log n 个不同元素的 n 元素数组进行排序有任何想法吗此外您通常如何处理具有多个非不同元素的数组 O 日志日志 n 时间足以让
分割如何提高埃拉托斯特尼筛法的运行时间？

我遇到了埃拉托色尼筛的分段实现它的运行速度比传统版本快很多倍有人可以解释一下分段如何提高运行时间吗请注意我想在其中找到素数 1 b 它适用于这个想法用于查找 10 9 之前的质数我们首先生成 sqrt 10 9 以下的筛选素数
计算产生相同 BST 的唯一节点序列的数量

问题给定一个最多 50 个整数的特定序列它们代表某个二叉搜索树 BST 的节点有多少种排列这个序列在那里这也会产生完全相同的空白石板时间将原始序列作为 1 个序列包含在总计数中例如对于这样的序列 5 2 1 9 8 答案
跨线反映点的算法

给定一个点 x1 y1 和一条直线的方程 y mx c 我需要一些伪代码来确定反映直线上第一个点的点 x2 y2 花了大约一个小时试图弄清楚但没有运气请参阅此处的可视化 http www analyzemath com Geometry
独立于符号的字符串的模式匹配

我需要一种算法可以在数据中找到预定义的模式以字符串的形式存在独立于数据和模式的实际符号字符我只关心符号之间的关系而不关心符号本身数据中的同一符号具有不同的模式符号也是合法的模式匹配算法必须强制执行的唯一一件事是保留模式中同一
计算素数并附加到列表

我最近开始尝试使用 python 解决 Euler 项目的问题并且在尝试计算素数并将其附加到列表中时遇到了这个障碍我编写了以下代码但我很困惑为什么它在运行时不输出任何内容 import math primes def isPrime
天气预报算法多样

目前英国气象局的预测引发了一场巨大的风暴他们预测冬季将是温和潮湿的冬季而北爱尔兰的气温却是有记录以来最冷的地面上有厚厚的积雪这在 12 月通常很少见这是我很想尝试的东西并不是我声称我可以击败他们而是想知道人们目前正在使用
使用回溯（而不是 DFS）背后的直觉

我正在解决单词搜索 https leetcode com problems word search description LeetCode com 上的问题给定一个 2D 板和一个单词查找该单词是否存在于网格中该单词可以由顺序相邻单
硬币兑换的空间优化解决方案

给定一个值 N 如果我们想要找 N 分钱并且我们有无限供应每种 S S1 S2 Sm 价值的硬币我们可以有多少种找零方式硬币的顺序并不重要例如对于 N 4 且 S 1 2 3 有四种解 1 1 1 1 1 1 2 2 2 1 3
比较周期性数据的快速方法

假设我有任意类型的数据集 A B C D 并且我想将其与另一个数据集进行比较我希望 A B C D B C D A C D A B 和 D A B C 的比较成立但是不适用于 A C B D 或任何其他未类似排序的集合有什么快速方法可
这个洗牌算法有什么问题吗？

我一直在做一些休闲假期计算我的迷你项目是模拟意大利游戏 tomboli 一个关键的组成部分是对以下过程的模拟游戏由一名男子控制他拿着一袋 90 个弹珠编号为 1 到 90 他从袋中随机取出一颗弹珠每次向玩家喊出弹珠编号经过一番思
用 ruby 解决旅行商问题（50 多个位置）

我在一家快递公司工作目前我们手动解决了 50 多个地点的路线我一直在考虑使用 Google Maps API 来解决这个问题但我读到有 24 点的限制目前我们在服务器中使用 Rails 因此我正在考虑使用 ruby 脚本来获取
如何检查一个盒子是否适合另一个盒子（允许任何旋转）

假设我有两个盒子每个盒子都是一个长方体 http en wikipedia org wiki Rectangular cuboid aka长方体我需要编写一个函数来决定盒子是否具有尺寸一二三可以装入具有尺寸的盒子中甲乙丙
无痛“算法分析”培训？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我在大学时曾有过一次关于算法分析课程的痛苦经历但最近发现在大学中需要它真实世界无论如何我正在
如何最小化两个子多边形的最大纵横比？

我想使用直线将凸多边形切成给定面积比的两部分以使两个子多边形的较大纵横比最小化目前我的方法包括选择一个随机起点计算将多边形分割成目标区域的适当终点然后计算两个纵横比中较大的一个然后重复这个很多次直到我足够接近最小值多边形 A
如何对数组进行排序（索引）以使用这些索引将原始数组从最小到最大值排序

例如我有这个数组 int a 6 10 16 11 7 12 3 9 8 5 我想像这样对其索引进行排序 6 9 0 4 8 7 1 3 5 2 所以我可以使用索引将 a 从最小到最大值排序在我的代码中我得到了这个 6 9 4 8 7 4
如何找到最长的回文子序列（不是它的长度）

我想找出字符串中最长的回文子序列我到处都找到了找出子序列长度的算法并声明该算法也可以扩展以返回子序列但我没有找到如何实现的有人能解释一下我怎样才能得到序列吗既然你提到了链接最长回文子序列 http www geeksforgeek
Java：使用indexOf方法根据另一个数组对数组进行排序

我想根据另一个数组索引的排序顺序迭代两个数组 A B 在本例中为 10 34 32 21 String A a b c d String B e f g h int indexes 10 34 32 21 为这里的坏例子道歉我已经更新
给定两个（大）点集，我如何有效地找到彼此最接近的点对？

我需要解决一个计算问题该问题归结为搜索两个集合之间最接近的点对问题是这样的给定欧几里德空间中的一组点 A 和一组点 B 找到所有对 a b 使得 b 是 B 中与 a 最近的点 a 是 A 中与 b 最近的点集合 A 和 B 的大小
如何动态查找连接组件

使用不相交集数据结构可以很容易地得到图的连通分量而且它只是支持增量连接组件 http www boost org doc libs 1 46 1 libs graph doc incremental components html 然而

随机推荐

后端和前端在不同端口上运行，后端重定向时出现 CORS 错误

我在不同的端口 8000 8001 上运行后端和前端我无法从 Express 服务器进行 res redirect 并且浏览器显示 CORS 错误访问 XMLHttpRequest at 这是MEVN Mongo Express Vue
读取所有目录中的所有文件[重复]

这个问题在这里已经有答案了我有代码可以读取单个文本文件的值但在读取所有目录中的所有文件并将所有内容放在一起时遇到困难这是我所拥有的 filename filesuffix location os path join Test file
如何使用命令行从 biml 生成 ssis 包并在服务器上部署 ssis

我致力于创建 biml 从中生成 ssis 包构建SSIS项目然后在服务器上部署ispac文件但这些所有手动步骤可以自动化吗我可以使用命令行从 biml 生成 ssis 吗除了 bidshelper 之外还有哪些命令以及在计算机
Firebase 多次更新期间出现权限被拒绝错误

我在 Firebase 上使用多个更新功能其中我创建了一个对象该对象一次更新数据库中的多个位置我已分别授予每个位置的写入权限以下是我尝试在 Firebase 上更新的内容的示例作为多次更新的一部分 alarms 298302f2
在一个窗口中绘制多个 csv 文件

我有一份 701 的清单csv文件每个列都有相同的列数 7 但行数不同 25000 到 28000 之间这是第一个文件的摘录 Date Week Week Day Hour Price Volume Sale Purchase 18 0
Flutter firestore - 检查文档 ID 是否已存在

如果文档 ID 尚不存在我想将数据添加到 firestore 数据库中到目前为止我尝试过的 varuId the ID that is set to the document when created var firestore Fir
jenkins 管道中的该模块需要 boto3 和 botocore

我正在尝试通过 jenkins groovy 脚本运行 ansible playbook 但不断收到错误 boto3 is required 我已经安装了 boto3 pip list boto grep boto boto3 1 20 3
Socket.Select 返回错误“尝试对非套接字的内容进行操作”

当使用经验证仅包含 Socket 对象的列表调用 Socket Select 时我有时会收到错误An operation was attempted on something that is not a socket 我找不到发生的模式
正则表达式：使用 re.sub 将连字符替换为破折号

我正在使用一个小函数来循环文件以便任何连字符被破折号取代替代键 0150 我使用的函数为相关问题的解决方案添加了一些正则表达式风格如何自动替换多个文件的文本内容中的字符 https stackoverflow com questio
如何有条件地替换 Pandas 中的 NaN 值？

我正在使用著名的泰坦尼克号数据集来解决我的第一个 Kaggle 问题我陷入了数据集的困境我想替换 Age 性别的 NaN 值例如男性的缺失值应替换为男性的平均年龄反之亦然虽然我的代码运行良好但出现以下异常设置复制警告尝试
使用 mongoose 中间件删除依赖文档时的并发问题

假设我们有一个简单的应用程序用户可以在其中创建产品并对其进行评论产品和评论的架构可以是 var productSchema new mongoose Schema author id ObjectId description Strin
CMake add_custom_target 取决于正在构建的整个项目

我想添加一个依赖于成功构建的整个项目的测试目标而无需重新指定对所有库或可执行文件的依赖关系我会在 make 中将其写为 all foo bar foo bar test all test sh test sh 隐式使用 foo 和 ba
如何在 Mathematica 中生成这样的图像

I am thinking of process an image to generate in Mathematica given its powerful image processing capabilities Could anyo
如何在 F# 中获取模块的类型

如何获取模块的 System Type 例如模块 module Foo let bar 1 这不起作用 printfn s typeof
由于未找到多部分边界，请求被拒绝

我在 LightBox 中使用包含一些输入元素的表单
运行多个异步任务并等待它们全部完成

我需要在控制台应用程序中运行多个异步任务并等待它们全部完成然后再进行进一步处理那里有很多文章但我似乎越读越困惑我已经阅读并理解了任务库的基本原理但我显然在某处缺少链接我知道可以链接任务以便它们在另一个任务完成后启动这几乎是
根据环境自动装配 symfony CacheInterface

我正在尝试在我的环境中使用不同的缓存系统我想要例如 Filesystem for dev and memcached for prod 我在用交响乐3 3 10 为了实现这一点我想自动装配缓存接口如下 use Psr SimpleCa
Python字符串替换方法——替换一个单词的多个实例

def translate sent trans merry god christmas jul and och happy gott new nytt year r word list sent split for word in wor
以编程方式移动辅助功能焦点

按下按钮时是否可以将辅助功能焦点 iOS 的 VoiceOver 和 Android 的 Talkback 移动到定义的小部件我尝试过在语义包 https api flutter dev flutter semantics semanti
DJB 哈希函数中数字 5381 的原因是什么？

谁能告诉我为什么 DJB 哈希函数中使用数字 5381 DJB 哈希函数定义为 h 0 5381 h i 33h i 1 s i 这是一个 C 实现 unsigned int DJBHash char str unsigned int le

DJB 哈希函数中数字 5381 的原因是什么？

DJB 哈希函数中数字 5381 的原因是什么？ 的相关文章

随机推荐

热门标签

DJB 哈希函数中数字 5381 的原因是什么？的相关文章