Anagrams - C 中的链式哈希和探测

2023-12-01

我的标题被编辑了，所以我想确保每个人都知道这是作业。问题只是优化程序，散列是我的想法。

我正在优化一个 C 程序，该程序将彼此不同的单词组合在一起，然后将它们打印出来。

目前的程序基本上是一个链表的链表。外部列表中的每个链接都是一组彼此不同的单词。

该程序的概要文件显示，到目前为止，执行时间的最大部分是函数wordLookup。这是因为它必须搜索每个节点，并且从文件中读取可能有 100k 个单词，这可能需要很长时间。例如，这是gprof40k 字阅读输出：

Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total
 time   seconds   seconds    calls  us/call  us/call  name
100.31      1.48     1.48    40000    37.12    37.12  wordLookup
  0.00      1.48     0.00    78235     0.00     0.00  newnode
  0.00      1.48     0.00    40000     0.00     0.00  sort_string
  0.00      1.48     0.00    38235     0.00     0.00  wordInsert
  0.00      1.48     0.00     1996     0.00     0.00  swap_words
  0.00      1.48     0.00     1765     0.00     0.00  wordAppend

我的想法是，将数据结构更改为哈希表，将彼此的所有字谜链接在同一个槽中。

根据我的教授所说的以及我在这里读到的内容，我正在为我的哈希函数考虑类似的东西。（注：素数的分布使得最常用的字母是低位数字，而最少使用的是高位数字。）

sort(string)

array alpha_primes = 5,71,37,29,2,53,59,19,11,83,79,31,43,13,7,67,97,23,17,3,41,73,47,89,61,101
hash(String) {
  hash = 1
  for (char in String) {
    hash *= alpha_primes[char-'a'];
  }
  return hash % tablesize
}

这个问题是否有一个哈希表大小可以适当地分配值，使得每组字谜在表中都有不同的索引？

如果这是不可能的，那么我应该：

将单词列表链接在一起（列表的列表）
使用探测（线性或二次）解决方案
对于这两种情况，比较起来有哪些优点/缺点？

无法保证哈希值是唯一的。碰撞的概率可以通过生日问题来计算，最好的办法就是尽量减少它。

2 个组哈希为相同值的概率可近似为 1-e^((-k(k-1))/2n)，其中 k 是您拥有的组总数（与您的单词大致相同） count），n 是哈希的搜索空间（2^（哈希的长度））。

我的字典大约有 100000 个单词，使得 32b 散列非常好（碰撞的 2%）。然而，这么大的哈希表将使用 4GB 的 RAM。使用较小的表意味着更多的碰撞。链接或探测不会在时间上产生巨大的差异。

正如对您的问题的评论中所建议的那样，试验最终将得到一个较小的数据结构。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Hash

anagram

Anagrams - C 中的链式哈希和探测的相关文章

数据模板绑定垃圾邮件输出窗口出现错误：找不到管理 FrameworkElemen

我有问题 System Windows Data 错误 2 找不到目标元素的管理 FrameworkElement 或 FrameworkContentElement BindingExpression 无路径数据项空目标元素是 So
FileStream 构造函数和默认缓冲区大小

我们有一个使用 NET 4 用 C 编写的日志记录类我想添加一个构造函数参数该参数可以选择设置文件选项 WriteThrough http msdn microsoft com en us library system io fileo
在 Xamarin 中隐藏软键盘

如何隐藏软键盘以便在聚焦时显示Entry在 Xamarin forms 便携式表单项目中我假设我们必须为此编写特定于平台的渲染器但以下内容不起作用我创建自己的条目子类 public class MyExtendedEntry Entr
防止 boost::asio::io_context 在空轮询调用时停止

此代码调用发布的句柄 boost asio io context ioc boost asio post ioc std cout lt lt lol lt lt std endl ioc poll 而这并没有 boost asio io
GCC 和 ld 找不到导出的符号...但它们在那里

我有一个 C 库和一个 C 应用程序尝试使用从该库导出的函数和类该库构建良好应用程序可以编译但无法链接我得到的错误遵循以下形式 app source file cpp text 0x2fdb 对 lib namespace Get
ASP.Net Core 内容配置附件/内联

我正在从 WebAPI 控制器返回一个文件 Content Disposition 标头值自动设置为附件例如处置附件文件名 30956 pdf 文件名 UTF 8 30956 pdf 当它设置为附件时浏览器将要求保存文件而不是打
vs2008 c#：Facebook.rest.api如何使用它来获取好友列表？

如何在此基础上取得进一步的进步获取好友列表的下一步是什么 string APIKey ConfigurationManager AppSettings API Key string APISecret ConfigurationManag
在 JSQMessagesViewController 中显示 LocationMediaItem

我刚刚尝试实施LocationMediaItem in my Xamarin iOS应用程序使用JSQMessagesViewController 一切都很顺利唯一的问题是UICollectionView应该显示位置的单元格永远停留在加载
C# 构建一个 webservice 方法，它接受 POST 方法，如 HttpWebRequest 方法

我需要一个接受 POST 方法的 Web 服务访问我的服务器正在使用 POST 方法它向我发送了一个 xml 我应该用一些 xml 进行响应另一方面当我访问他时我已经使用 HttpWebRequest 类进行了管理并且工作正常
C++ php 和静态库

我创建了一个library a 其中包含 cpp 和 h 文件其中包含很多类嵌套类和方法我想在 php 示例中包含这个静态库并尝试使用它我想提一下我是 php 新手我已经在 test cpp 文件中测试了我的 libray a
给出 5 个参数，但在终端中只得到 3 个参数

我想将一个文件传递给一个c 程序如果我在 IDE 中执行此操作 test string string lt test txt return argc 5 但在终端上我刚刚得到argc 3 看来这是因为什么是 lt 意思是我正在使用
如何在标准 WPF ListView 中启用 UI 虚拟化

我正在使用 NET 4 5 VS2012 并且我有一个 ListView 看起来像这样
运行选定的代码生成器时出错：“未将对象引用设置到对象的实例。”错误？

我已经尝试了所有解决方案例如修复 VS 2013 但没有用当您通过右键单击控制器文件夹来创建控制器并添加控制器时然后右键单击新创建的控制器的操作并选择添加视图当我尝试创建视图时就会发生这种情况它不是一个新项目而是一个现有项目
如何通过 JsonConvert.DeserializeObject 在动态 JSON 中使用 null 条件运算符

我正在使用 Newtonsoft 反序列化已知的 JSON 对象并从中检索一些值如果存在关键在于对象结构可能会不断变化因此我使用动态来遍历结构并检索值由于对象结构不断变化我使用 null 条件运算符来遍历 JSON 代码看起来像这
每个租户的唯一用户名和电子邮件

我正在使用以下代码编写多租户应用程序ASP NET Core 2 1 我想覆盖默认的与用户创建相关的验证机制目前我无法创建多个具有相同的用户UserName My ApplicationUser模型有一个名为TenantID 我想要实现的
cout 和字符串连接

我刚刚复习了我的 C 我尝试这样做 include
跨多个域的 ASP.NET 会话

是否有合适的 NET 解决方案来在多个域上提供持久服务器会话即如果该网站的用户在 www site1 com 下登录他们也将在 www site2 com 下登录安全是我们正在开发的程序的一个问题 Thanks 它是否需要在会话中
C++ Streambuf 方法可以抛出异常吗？

我正在尝试找到一种方法来获取读取或写入流的字符数即使存在错误并且读写结束时间较短该方法也是可靠的我正在做这样的事情 return stream rdbuf gt sputn buffer buffer size 但如果streamb
将 char[][] 转换为 char** 会导致段错误吗？

好吧我的 C 有点生疏了但我想我应该用 C 来做我的下一个小项目这样我就可以对其进行抛光并且我已经有不到 20 行的段错误了这是我的完整代码 define ROWS 4 define COLS 4 char main map
QFileDialog::getSaveFileName 和默认的 selectedFilter

我有 getSaveFileName 和一些过滤器我希望当用户打开保存对话框时选择其中之一 Qt 文档说明如下可以通过将 selectedFilter 设置为所需的值来选择默认过滤器我尝试以下变体 QString selFilte

随机推荐

将 DataTable 分配给 ComboBox，然后进行更改

VB2010 我手动创建了一个数据表因此它不是来自数据库我已将其分配给组合框它显示我的数据列如果我更改数据表是否必须重新建立链接 assign first table dt GetFirstTable cbo DataSource
为什么 UIGraphicsGetCurrentContext 在 UIGraphicsBeginImageContext 之后返回 nil

我正在按照代码示例制作模糊的 UILabel https stackoverflow com a 62224908 2226315 我的要求是在标签初始化后使标签模糊而不是调用blur运行时的方法但是当我尝试打电话时blur标签初始化
简单的画布动画

我有一个简单的画布动画两个矩形朝两个不同的方向移动但是我觉得这可以进一步简化 http jsfiddle net tmyie R5wx8 6 var canvas document getElementById canvas c ca
如何实现Android应用的SHARE功能？

有时我们可以看到单击某些共享按钮后会显示可共享方式的列表该列表似乎是动态生成的而不是硬编码的比如我手机上安装了SpringPad 有些应用的分享功能可以通过SpringPad分享内容但是它怎么知道我有SpringPad呢这
似乎无法从 ionic 项目生成 APK

我是 ionic 的新手试图获取用于调试的 apk 我在项目目录中使用了以下命令 ionic cordova platform add android 我确实得到了 platforms android 目录然后我用了 ionic cor
我可以通过 Google apps 脚本填写 TextItem 吗？

我使用 Google Form Builder 制作了一个表单然后为其添加了一个脚本我可以对受访者的电子邮件地址运行 Session getEffectiveUser getEmail 但我无法将其填写在文本框中来帮助他们我可以用 G
捏合缩放以实现自定义视图

我已经创建了自定义视图并且想为自定义视图应用捏缩放怎么做 Android 开发者博客上的这篇文章很好地涵盖了这个主题向下滚动到有关手势检测器理解多点触控如果您只想实现捏合缩放则只需要几行代码 private ScaleGestu
使用 ienumerable 实现 ienumerable

在泛型集合类中使用 IEnumerable Generic 接口实现 IEnumerable Non generic 需要什么 msdn 上的代码示例说明链接 http msdn microsoft com en us library 9
无法从传输连接读取数据：调用 WSACancelBlockingCall 中断了阻塞操作

我正在开发一个客户端服务器聊天应用程序当我关闭客户端窗口时遇到以下异常无法从传输连接读取数据调用 WSACancelBlockingCall 中断了阻塞操作知道可能是什么问题吗如果您对底层流的任何读取器或写入器调用 Close
迭代 RDD 并更新可变集合会返回空集合

我是 Scala 和 Spark 的新手希望得到一些帮助来理解为什么下面的代码没有产生我想要的结果我正在比较两个表我想要的输出模式是 case class DiscrepancyData fieldKey String fieldNa
Telerik MVC Grid：如何在列中使用 DropDownList？

我有一个 Telerik MVC 网格位于带有 Razor 的 MVC 3 应用程序中它是 Ajax 绑定的我现在尝试向其中添加一个下拉列表列以便用户可以在编辑模式下使用它但不知道如何操作网格显示产品列表我希望下拉列表包含可以
当我更新索引 0 处的对象时，Javascript 数组多次包含相同的对象，它会自动更新索引 1 处的对象吗？

您可以看到正在插入的对象中的ruleCounter属性为1 插入数组后我们可以看到ruleCounter属性的值为1 然后我尝试插入相同的对象但这次ruleCounter的值为2 但神奇的是在数组中你可以看到数组中两个对象中ruleCou
将数字转换为字母

给定一个数字如何将其转换为字母您可以将现有逻辑转换为 t sql 标量函数如下所示 CREATE FUNCTION dbo fnColumnNameFromIndex i int RETURNS varchar 3 AS BEGIN
添加迁移错误：未将对象引用设置为对象的实例

我正在使用代码优先的概念只是尝试将一个新类添加到 Models 文件夹中希望在 SQL Server 数据库中创建一个新表我已经添加 Public Overridable Property Diagnosis As DbSet Of
如何在 pyqt5 中将鼠标悬停在按钮上时显示工具提示图像

我想将鼠标悬停在按钮上时显示图像但是 pyqt5 工具提示参考仅包含文本我怎样才能做到这一点我想动态地执行 for 循环元素如下所示我需要完成 code def createButtons self for d name in d
Backbone & Slim PHP - Access-Control-Allow-Headers - 可以获取信息，不能发布信息吗？

我正在使用 Backbone 和 Slim PHP 框架我正在尝试将信息发布到我的 API 但是 Access Control Allow Headers 不断给我带来问题我的控制台显示 OPTIONS http api barholl
无法使用System.IO.Compression.FileSystem.dll

我正在尝试让这个 Powershell 代码正常工作 Add Type Path C Program Files x86 Reference Assemblies Microsoft Framework NETFramework v4 5
SQL Server：删除表级联等效吗？

在 Oracle 中要删除所有表和约束您可以输入类似的内容 DROP TABLE myTable CASCADE CONSTRAINTS PURGE 这将完全删除表及其依赖项 SQL服务器相当于什么在 SQL Server Manag
如何判断 net/http 的 ResponseWriter.Write() 是否已被调用？

假设我有一系列 net http 处理程序并且早期的处理程序响应 HTTP 错误 http StatusInternalServerError 例如如何在以下处理程序中检测到这一点并避免向客户端发送额外的数据或者这完全是错误的解决问
Anagrams - C 中的链式哈希和探测

我的标题被编辑了所以我想确保每个人都知道这是作业问题只是优化程序散列是我的想法我正在优化一个 C 程序该程序将彼此不同的单词组合在一起然后将它们打印出来目前的程序基本上是一个链表的链表外部列表中的每个链接都是一组彼此不同的单

Anagrams - C 中的链式哈希和探测

Anagrams - C 中的链式哈希和探测 的相关文章

随机推荐

热门标签

Anagrams - C 中的链式哈希和探测的相关文章