具有墓碑的哈希表的负载因子

2023-12-26

那么问题来了，在计算哈希表的负载因子时是否应该包括墓碑。

我认为，考虑到负载系数是用来确定何时扩展容量的，所以不应该包括墓碑。一个明显的例子是，如果您几乎填充然后删除哈希表中的每个值。这里的插入非常容易（没有碰撞），所以我相信负载因子不应该包括它们。

但您可能会看到这一点并认为所有墓碑查找都会很慢（可能会搜索几乎整个空间）。

所以我想我会问这个问题。哈希表的负载因子是否应该在计算中包括墓碑？

负载因子不是哈希表数据结构的重要组成部分——它是定义的方式动态系统的行为规则（增长/收缩哈希表是一个动态系统）。

此外，在我看来，在 95% 的现代哈希表情况下，这种方式过于简化，动态系统的表现并不理想。它的优点：

嗯，理解和实施都很简单。
哈希表数据结构不应该存储许多具有某些阈值的数字——可能只存储一个数字。当哈希表非常小时并且标头的大小影响总数据结构内存效率（以存储条目的字节为单位）时，这是有意义的。
在某些（和常见）情况下：仅附加/更新哈希表，更复杂的行为模型退化为“仅负载因子”模型，换句话说，负载因子模型定义相对最优的行为。

另请参阅我对负载因子模型的回答。我更喜欢[最小负载、目标负载、最大负载]+增长因子框架模型。 https://stackoverflow.com/a/23438573/648955

If you develop general-purpose hash table with tombstones, I think you can just pick up my results (below). I spend maybe several weeks solely developing this model. Maybe you can make some improvements or further research, I would be glad.

针对两种主要的哈希表动态行为模式：

growing hash table (maybe in growing phase), with little or no removals
- 当未指定（或未知）适当的容量时，哈希表的初始填充
hash table that remains of the same or nearly the same size, number of removals is equal or nearly equal to number of insertions
- 具有上限大小的缓存、LRU、具有条目过期的表

定义了两个阈值：

max size（即存活条目的数量），table size * max load
空闲（即空的，没有活动条目或墓碑）插槽的最小数量, 通过魔法公式计算 https://github.com/OpenHFT/Koloboke/blob/0b4898817f41b0820e0d9a2839fb593f112f9edc/lib/impl/src/main/javaTemplates/net/openhft/koloboke/collect/impl/hash/MutableDHash.java#L35.

如果哈希表大小超过max size，我们假设我们处于“增长模式”，重新哈希表大小以能够存储current size * growth factor恩茨岛e.选择最接近的桌子尺寸current size * growth factor / target load.

如果空闲槽数低于空闲槽位的最小数量，我们处于“缓存模式”，重新哈希“到当前大小”，i。 e.尽可能接近的桌子尺寸current size / target load.

Read 上述所有逻辑的源代码 https://github.com/OpenHFT/Koloboke/blob/0b4898817f41b0820e0d9a2839fb593f112f9edc/lib/impl/src/main/javaTemplates/net/openhft/koloboke/collect/impl/hash/MutableDHash.java.

另外，文章从哈希表中清除墓碑：理论与实践 https://github.com/OpenHFT/Koloboke/wiki/Tombstones-purge-from-hashtable:-theory-and-practice提供了一些线索。

如果您开发专门用途的哈希表，哪些动态属性是已知的（或可以研究的），我建议您开发自己的模型，适合您的情况。不要依赖纯数学和计算机科学理论，在基准测试中评估你的模型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

HashTable

loadfactor

具有墓碑的哈希表的负载因子的相关文章

将 Hashtable 转换为 xml 字符串，然后再转换回 HashTable，无需使用 .NET Serializer

有谁知道如何将 Hashtable 转换为 XML String 然后再转换回 HashTable 而不使用基于 NET 的 XMLSerializer 当代码在 IE 内部运行并且浏览器的保护模式打开时 XMLSerializer 会带来
我什么时候应该对整个哈希表进行重新哈希？

我如何决定何时应该对整个哈希表进行重新哈希这在很大程度上取决于您解决冲突的方式如果您使用线性探测负载系数远高于 60 左右时性能通常会开始严重下降如果您使用双散列 80 85 的负载因子通常是相当合理的如果使用碰撞链负载系数高
Java 中的散列键

在java中当我使用字符串作为Hashmap的键时我得到的结果与使用字符串哈希码作为HashMap中的键时的结果略有不同有什么见解吗当我使用字符串哈希码作为 HashMap 中的键时 You mustn t使用哈希码本身作为密钥哈
为什么HashMap要求初始容量是2的幂呢？

当我浏览Java的HashMap源代码时我看到了以下内容 The default initial capacity MUST be a power of two static final int DEFAULT INITIAL CAPAC
我可以将名为“keys”的键添加到哈希表而不覆盖“keys”成员吗

看来我无法将任意键名添加到hashtable如果具有该名称的成员已经存在则不会覆盖该成员我创建一个哈希表 x 并添加两个键 one and two x x one 1 x two 2 然后通过评估显示添加的键 x Keys x Keys
哈希表如何绑定到下拉列表？

在 vb net winforms 中哈希表如何绑定到下拉列表或任何其他数据源驱动的控件只需使用下拉列表的 Datasource 属性 DropDownList dd new DropDownList Hashtable mycount
C 的最小哈希函数？

我不能使用 boost hash 因为我必须坚持使用 C 而不能使用 C 但是我需要对大量 10K 到 100k 令牌字符串 5 到 40 字节长度进行哈希处理以便在这些字符串中进行搜索速度最快 MD5 SHA1 或任何长哈希函数对于
SML/NJ：如何使用哈希表？

我真的很想在 SML 中创建一个哈希表似乎 SML NJ 中已经有一个结构问题是我该如何使用它我还没有完全理解如何在SML中使用结构并且我读过的书中的一些非常基本的示例给了我错误我什至不知道如何纠正所以使用HashTable结
迭代 hastable 键的枚举会引发 NoSuchElementException 错误

我正在尝试使用枚举来迭代哈希表中的键列表但是我在列表中的最后一个键处不断收到 NoSuchElementException Hashtable
在 OCaml 中将哈希表转换为对（键，值）列表

OCaml 中有没有办法将哈希表转换为键对值列表我知道给定一个哈希表ht我们可以做的 BatList of enum BatHashtbl enum ht 使用电池库这会将表转换为枚举然后将枚举转换为列表但我正在寻找一种不使
为哈希选择合适的表大小

如果我有一个 1000 个键集我的哈希表的合适大小是多少如何确定它取决于负载系数表将增加其大小并重新分布其元素的满百分比点如果您知道正好有 1000 个条目并且该数字永远不会改变则只需将负载因子设置为 1 0 将初始大小设
Ruby 维护哈希插入顺序

我正在寻找一种方法来维护我在 Ruby 中使用的哈希的插入顺序我的数据来自数据库并且已经按照我想要的方式分组排序但 Ruby 不保证在我的版本中保持哈希中的顺序1 8 4 有什么解决方法吗如果没有我可以创建自定义比较器吗这是哈
C 中的布谷鸟哈希

有没有人有实施布谷鸟哈希 http en wikipedia org wiki Cuckoo hashing在C语言中如果有一个开源的非 GPL 版本那就完美了既然 Adam 在评论中提到了它有人知道为什么它没有被太多使用吗这只是一
碰撞解决：二次探测与单独链接

好的我一直在对哈希表和不同的冲突解决问题进行一些实验我试图找出哪个更有效地进行查找即使用单独的链接或二次探测来解决冲突的哈希表我的结果表明即使对于较小的负载因子例如 0 4 或 0 2 单独链接也比二次探测更快是这种情况还是我
Java 哈希表与对象引用的问题

我有一个哈希表例如 HashTable ht 1 1 2 1 3 1 现在我像 Integer foo Integer 1 一样实现它并像这样声明哈希表 HashTable ht foo foo 2 foo 3 foo 现在据我了解
构建哈希表/哈希函数

我想构建一个哈希表用于查找 1 到 15 个字节的字节序列字符串中的键我想存储一个整数值所以我想一个用于散列的数组就足够了我很难概念化如何构造一个哈希函数以便给定的键将给出数组的索引任何帮助将不胜感激哈希中的最大条目数为
传递给 Invoke-Command 的属性将类型从 IDictionary 更改为 HashTable

我运行时遇到错误Invoke Command其中脚本块采用字典类型的参数无法处理参数字典的参数转换无法转换类型的 System Collections Hashtable 值输入 System Collections Hashta
获取单词中重复次数最多的字母的数量

我正在尝试计算单词中重复次数最多的字母的数量 function GreatestCount str var count for var i 0 i
初始化 HashMap 的最佳方法

我通常会这样做 HashMap
什么时候使用哈希表？

什么情况下使用哈希表可以提高性能什么情况下不能哪些情况不适合使用哈希表什么情况下使用哈希表可以提高性能什么情况下不能如果您有理由关心请使用哈希表和您正在考虑的其他任何内容来实现将您的实际数据放入其中并衡量哪个性能更好也就是

随机推荐

无法对“XMLHttpRequest”执行“发送”

我正在开发一个使用ajax 的Cordova 应用程序我的问题是在调试中应用程序正在运行但是当我构建一个版本时我收到了错误 readyState 0 status 0 statusText NetworkError Failed
如何使 type="number" 只为正数

目前我有以下代码
在 TeamCity 构建步骤中获取构建作业 URL

我有一个 Microsoft Teams Webhook 当 TeamCity 构建失败时它会提醒我我想知道如何获取当前 TeamCity 版本的 URL 以便可以将此信息传递到我的 webhook 仅使用手头的参数您就可以将 uri
如何使用 Ajax 和 Jquery 从 PHP 数据库中提取信息，并使用该信息填充元素？

我正在调整一个网站以便员工更轻松地编辑产品现在必须有人登录数据库并更改价格然后必须有人更改网站本身的物理 html 因此我正在编写代码从数据库中提取所有产品并将它们显示在可以编辑的页面上我认为用 Ajax 来做所有事情都是最
阻止 Word 2010 保存 o:gfxdata base64 或 uuencoded VML？

我正在处理包含多个绘图画布的 docx 文件其中插入了图像以及在 Word 2010 中绘制的一些线条和箭头我使用的是没有兼容模式的 2010 格式 Word 插入一个o gfxdata属性到每个v shape and v group元
ORA-01400: 无法将 null 插入 (TABLE.COLUMN)（休眠）

我正在使用 hibernate 4 3 oracle 11 当我想插入一个员工时它与类别有一对多的关系一个类别有很多员工首先我将一个类别插入数据库然后我尝试将一个员工插入数据库并得到一个异常实体的代码是由hibernate生成的
如何在 PowerShell 中标准化路径？

我有两条路 fred frog and frag 我可以在 PowerShell 中将它们连接在一起如下所示 join path fred frog frag 这给了我这个 fred frog frag 但我不想要这样我想要一个没有双点
Android - 具有多个底部导航菜单的导航组件

我有一个 Android 应用程序 Java 它使用导航组件来设置底部导航该应用程序由一个活动主组成其他所有内容都以片段形式加载这个想法是让启动屏幕启动并检查用户是否登录如果用户登录则加载主屏幕并且底部导航之前隐藏变得可见
C# - 编译器错误 - 将 int[] 分配给 object[] 时

namespace ConsoleApplication1 class Program static void Main string args object obj new object 3 obj 0 new object obj 1
为什么在 c 中嵌入 python 时无法导入“math”库？

我正在使用 python 2 6 文档中的示例开始尝试在 C 中嵌入一些 python C 代码示例 http docs python org extending embedding html pure embedding不允许我执行以下
设置可选的禁用属性

我想禁用表单中的所有字段这些字段在加载页面时具有值例如在这个 td Html TextBoxFor m gt m PracticeName new style width 100 disabled Model PracticeName
Windows 8 上的 WP7 SDK

是否可以在 Windows 8 Release Preview 上安装 WP7 SDK 我尝试使用标准安装包 http www microsoft com en us download details aspx id 29233但不断收到以
如何使用fortran读取不规则行

我有一个格式如下的文本文件 1 2 3 4 5 6 7 对于许多行等等我运行这个 fortran 程序 i 1 tt 1 do while true read unit 1 IOSTAT status lon i tt lat i tt
将表列移动到新表并在 PostgreSQL 中作为外键引用

假设我们有一个包含字段的数据库表 id category subcategory brand name description etc 创建单独的表的好方法是什么category subcategory and brand以及原始表中相应的
使用 Django Rest Framework 从模型序列化属性（getter 和 setter）时出现问题

我想在序列化器中使用我的模型中的属性包括设置器但显然设置器从未被调用模型 py class Awesome models Model value models TextField def set value self value s
将 NavigationView 背景更改为圆形在按下时不起作用

我正在使用设置导航项背景app itemBackground在布局中
如何从命令行覆盖 grails 配置

我正在尝试覆盖dataSource url从命令行运行 grails 的值示例 grails
错误：包路径 ./compat 未从包中导出

Note 我想我能够重现这个参见堆栈闪电战示例 https stackblitz com edit angular fire start np32w7 file app 2Fapp component ts 错误在控制台中打印为 INTE
如何在 SSIS 中的执行 SQL 任务中使用参数映射？

我正在尝试检索的值Key通过 SSIS 中的简单 select 语句从表中获取Execute SQL Task 但没有运气找出这个错误我使用了一个字符串数据类型的输入变量并在参数映射中使用了该变量Execute SQL Task 执行查
具有墓碑的哈希表的负载因子

那么问题来了在计算哈希表的负载因子时是否应该包括墓碑我认为考虑到负载系数是用来确定何时扩展容量的所以不应该包括墓碑一个明显的例子是如果您几乎填充然后删除哈希表中的每个值这里的插入非常容易没有碰撞所以我相信负载因子不应该包括

具有墓碑的哈希表的负载因子

具有墓碑的哈希表的负载因子 的相关文章

随机推荐

热门标签

具有墓碑的哈希表的负载因子的相关文章