对于英语单词来说，什么是好的哈希函数？

2023-12-24

我有一长串英语单词，我想对它们进行哈希处理。什么是好的哈希函数？到目前为止，我的散列函数对字母的 ASCII 值求和，然后对表大小取模。我正在寻找有效且简单的东西。

简单地对字母求和并不是一个好的策略，因为排列会给出相同的结果。

这个（djb2 http://www.cse.yorku.ca/%7Eoz/hash.html) 非常流行并且可以很好地处理 ASCII 字符串。

unsigned long hashstring(unsigned char *str)
{
    unsigned long hash = 5381;
    int c;

    while (c = *str++)
        hash = ((hash << 5) + hash) + c; /* hash * 33 + c */

    return hash;
}

更多信息here https://stackoverflow.com/questions/1579721/why-are-5381-and-33-so-important-in-the-djb2-algorithm.

如果您需要更多替代方案和一些绩效衡量标准，请阅读here http://www.strchr.com/hash_functions.

Added:这些都是general散列函数，其中输入域事先未知（也许除了一些非常一般的假设：例如，上面的方法对于 ascii 输入稍好一些），这是最常见的情况。如果您有一个已知的受限域（固定的输入集），您可以做得更好，请参阅 Fionn 的答案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Hash

对于英语单词来说，什么是好的哈希函数？的相关文章

如何在多线程C++ 17程序中交换两个指针？

我有两个指针 pA 和 pB 它们指向两个大的哈希映射对象当pB指向的哈希图完全更新后我想交换pB和pA 在C 17中如何快速且线程安全地交换它们原子我是 c 17 的新手 2个指针的原子无等待交换可以通过以下方式实现 inclu
IdentityServer 4 对它的工作原理感到困惑

我阅读和观看了很多有关 Identity Server 4 的内容但我仍然对它有点困惑因为似乎有很多移动部件我现在明白这是一个单独的项目它处理用户身份验证我仍然不明白的是用户如何注册它谁存储用户名密码我打算进行此设置 Rea
如何在C（Linux）中的while循环中准确地睡眠？

在 C 代码 Linux 操作系统中我需要在 while 循环内准确地休眠比如说 10000 微秒 1000 次我尝试过usleep nanosleep select pselect和其他一些方法但没有成功一旦大约 50 次它
JNI 将 Char* 2D 数组传递给 JAVA 代码

我想从 C 代码通过 JNI 层传递以下指针数组 char result MAXTEST MAXRESPONSE 12 12 8 3 29 70 5 2 42 42 在java代码中我写了以下声明 public static native
Visual Studio 在构建后显示假错误

我使用的是 Visual Studio 2017 构建后 sln在调试模式下我收到错误但是当我通过双击错误列表选项卡中的错误来访问错误时错误会从页面中消失并且错误数量也会减少我不太确定这种行为以及为什么会发生这种情况有超过 2
使用可变参数包类型扩展的 C++ 函数调用者包装器

我绑定了一些 API 并且绑定了一些函数签名如下所示 static bool WrapperFunction JSContext cx unsigned argc JS Value vp 我尝试将对象和函数包装在 SpiderMonkey
对 std::vector 进行排序但忽略某个数字

我有一个std vector
在Linux中，找不到框架“.NETFramework，Version=v4.5”的参考程序集

我已经设置了 Visual studio 来在我的 Ubuntu 机器上编译 C 代码我将工作区我的代码加载到 VS 我可以看到以下错误 The reference assemblies for framework NETFramewo
将 Long 转换为 DateTime 从 C# 日期到 Java 日期

我一直尝试用Java读取二进制文件而二进制文件是用C 编写的其中一些数据包含日期时间数据当 DateTime 数据写入文件以二进制形式时它使用DateTime ToBinary on C 为了读取 DateTime 数据它将首
类型约束

我有以下类层次结构 class Header IEnumerable
如何在 C 中安全地声明 16 位字符串文字？

我知道已经有一个标准方法前缀为L wchar t test literal L Test 问题是wchar t不保证是16位但是对于我的项目我需要16位wchar t 我还想避免通过的要求 fshort wchar 那么 C 不是 C
检测到严重错误 c0000374 - C++ dll 将已分配内存的指针返回到 C#

我有一个 c dll 它为我的主 c 应用程序提供一些功能在这里我尝试读取一个文件将其加载到内存然后返回一些信息例如加载数据的指针和内存块的计数到 c Dll 成功将文件读取到内存但在返回主应用程序时程序由于堆损坏而崩溃检测
Unity：通过拦截将两个接口注册为一个单例

我有一个实现两个接口的类我想对该类的方法应用拦截我正在遵循中的建议Unity 将两个接口注册为一个单例 https stackoverflow com questions 1394650 unity register two inter
将数组作为参数传递

如果我们修改作为方法内参数传递的数组的内容则修改是在参数的副本而不是原始参数上完成的因此结果不可见当我们调用具有引用类型参数的方法时会发生什么过程这是我想问的代码示例 using System namespace Value Re
实体框架中的“it”是什么

如果以前有人问过这个问题请原谅我但我的任何搜索中都没有出现它我有两个数据库表 Person 和 Employee 对每个类型的表进行建模例如 Employee is a Person 在我的 edmx 设计器中我定义了一个实体
在 Windows Phone silverlight 8.1 上接收 WNS 推送通知

我有 Windows Phone 8 1 silverlight 应用程序我想使用新框架 WNS 接收通知我在 package appxmanifest 中有
如何减少具有多个单元的 PdfPTable 的内存消耗

我正在使用 ITextSharp 创建一个 PDF 它由单个 PdfTable 组成不幸的是对于特定的数据集由于创建了大量 PdfPCell 我遇到了内存不足异常我已经分析了内存使用情况我有近百万个单元格的 1 2 在这种情况下有
灵气序列解析问题

我在使用 Spirit Qi 2 4 编写解析器时遇到一些问题我有一系列键值对以以下格式解析
如何将十六进制字符串转换为无符号长整型？

我有以下十六进制值 CString str str T FFF000 如何将其转换为unsigned long 您可以使用strtol作用于常规 C 字符串的函数它使用指定的基数将字符串转换为 long long l strtol str
不区分大小写的字符串比较 C++ [重复]

这个问题在这里已经有答案了我知道有一些方法可以进行忽略大小写的比较其中涉及遍历字符串或一个good one https stackoverflow com questions 11635 case insensitive string

随机推荐

服务器端控件的输入类型

我正在使用 asp net 构建 ipad web 应用程序我知道使用input type email 将导致 iPad 上的键盘布局发生更改以便比默认设置更轻松地处理电子邮件输入问题是我正在使用服务器端文本框控件有谁知道如何让服务
如何锁定滑块并防止用鼠标将值更新到 dat.GUI 菜单中

我尝试实现一种方法来防止用鼠标更新值实际上当three js动画已开始通过单击按钮启动目前我有以下内容dat GUI menu 单击开始按钮后我想阻止用户用鼠标修改参数 Rotation x and Rotation y 这是
列表作为字典中不可 JSON 序列化的条目

我需要将列表或 numpy 数组保存为 JSON 文件中的条目之一我收到不可 JSON 序列化错误并且我不知道如何修复它以及为什么当我手动将列表传递到字典时我没有收到它 My code def get col stats co
使用 AlaSQL 和 JQuery 加载 CSV 文件

我正在构建一个基于 HTML 的应用程序用于使用 AlaSQL 查询导入的 CSV 文件我开始于这个演示 http alasql org demo 008file 并尝试通过设置来实现相同的行为onChange事件通过 JQuery 而
给定多个节点，求 AVL 树的最小和最大高度？

给定一定数量的节点是否有公式可以计算 AVL 树的最大和最小高度例如课本问题 3 个节点 5 个节点和 7 个节点的 AVL 树的最大最小高度是多少课本答案 3 个节点的 AVL 树的最大最小高度为 2 2 5 个节点的 AVL
如何在 IntelliJ 中配置 dagger

我下载了 dagger 因为它似乎是 Android 中依赖注入的一个不错的选择但我在集成编译器时遇到了一些麻烦有关于正确设置的任何提示吗我遵循了有关 android 注释的说明因为这个项目似乎很相似但这对匕首不起作用我做了什么
在 p:dataTable 上执行搜索后，p:dataTable 中的 p:fileDownload 不起作用（仅刷新页面）

我有一个 JSF PrimeFaces Web 应用程序在一页中
Eclipse 中的“与编辑器链接”功能有什么作用？

我是 Eclipse 新手也不了解 NetBeans 我正在阅读 eclipse 教程但我很困惑无法理解与编辑器链接到底是做什么的 Eclipse gt 帮助中说选择本地工具栏或其中之一的视图菜单中的与编辑器链接按钮导航视
套接字传递十六进制值

我正在尝试将套接字中的字符串值传递到另一台服务器另一个服务器应该接收十六进制格式的值即如果我的字符串在服务器上是 s 600185838e 它应该收到 60 01 85 83 8e 但是我发送的这些值已转换为 ASCII 并且不是所需
将文本输入放在单选按钮的标签内？

我正在尝试创建一个指定一堆选项的单选组以及一个带有要指定的文本输入的额外选项其他我正在使用的这个特定单选按钮的代码是
静态成员中的通用参数声明

为什么不允许定义这样的静态成员 private static final
再次针对特定异常启用中断

我是 Visual Studio 的新手我现在正在编程当我在 Visual Studio 的调试器中启动程序时一切正常当我按下一个按钮时它集中了我的代码并弹出一个框带有指向有错误的行的箭头说明错误是什么但我取消选中了上面的检
go 中定期运行一个函数

我有一个这样的函数 func run cmd string byte out err exec Command cmd Output if error nil log Fatal err return out 我想以这种方式运行这个命令 r
将 2 个嵌套数组合并为一个具有多个值的数组

我有 2 个这样的嵌套数组 array 1 0 gt array 1 id gt 6 1 gt array 1 id gt 4 array 1 0 gt array 1 id gt 509 1 gt array 1 id gt 256 我正
如何修复预期响应包含数组但获得对象 ANGular js

我是新人在调用服务后使用资源模块很难得到这个错误任何人都可以修改我在代码中出错的地方或者只是修改其中需要纠正的部分谢谢即将到来的数据格式 brands Array 1 0 Object v 0 id 5251a4a34f232fc
配置文件与 gcc/g++ 和 ld 的链接时间

我正在使用 g 编译和链接一个由大约 15 个 c 源文件和 4 个共享对象文件组成的项目最近链接时间增加了一倍多但我没有可用的 makefile 的历史记录有没有办法分析 g 以查看链接的哪一部分花费了很长时间 Edit 当我注意
如何确定 PHP 字符串是否仅包含纬度和经度

我必须使用可能包含纬度经度数据的字符串如下所示 query 33 805789 151 002060 query 33 805789 151 002060 query OVER HERE 33 805789 151 002060 就我的
保存片段状态操作栏选项卡

我正在构建一个由带有选项卡的操作栏组成的应用程序每个选项卡都包含一个片段其中一个片段有需要加载的数据所以我希望数据只在第一次加载当用户更改选项卡并返回到包含该片段的选项卡时不会等待再次加载数据我假设我必须使用某种方式保存数据以
Java中用外国字符替换英文字符的方法？

在 PHP 中我会使用这个 text Je prends une th chaud s il vous pla t search array etc replace array e i e etc text str replace sear
对于英语单词来说，什么是好的哈希函数？

我有一长串英语单词我想对它们进行哈希处理什么是好的哈希函数到目前为止我的散列函数对字母的 ASCII 值求和然后对表大小取模我正在寻找有效且简单的东西简单地对字母求和并不是一个好的策略因为排列会给出相同的结果这个 djb2

对于英语单词来说，什么是好的哈希函数？

对于英语单词来说，什么是好的哈希函数？ 的相关文章

随机推荐

热门标签

对于英语单词来说，什么是好的哈希函数？的相关文章