基数树/patricia trie 中的前缀搜索

2023-11-23

我目前正在实现一个基数树/帕特里夏特里（无论你想怎么称呼它）。我想用它在功能严重不足的硬件上的字典中进行前缀搜索。它应该或多或少像自动完成一样工作，即。 e.显示与键入的前缀匹配的单词列表。

我的实现是基于关于这篇文章，但其中的代码不包括前缀搜索，尽管作者说：

[...] 假设您想要枚举所有具有公共前缀“AB”的键的节点。您可以从该根开始执行深度优先搜索，只要遇到后边缘就停止。

但我不明白这应该如何运作。例如，如果我从这些单词构建一个基数树：

illness
假想
想像力
想象
模仿
即时
立即地
巨大
in

对于前缀“i”和“in”，我将获得完全相同的“最佳匹配”，因此对我来说，仅通过从最佳匹配遍历树来收集所有匹配的单词似乎很困难。

此外，还有一个Java中基数树的实现已实现前缀搜索RadixTreeImpl.java。该代码显式检查所有节点（从某个节点开始）是否有前缀匹配 - 它实际上比较字节。

谁能指出我在基数树上实现前缀搜索的详细描述？ Java实现中使用的算法是唯一的方法吗？

想想你的 trie 编码了什么。在每个节点，您都有通往该节点的路径，因此在您的示例中，您从对应于空字符串的根节点 Λ（这是一个大写的 Lambda，这种希腊字体有点糟糕）开始。 Λ 对于所使用的每个字母都有子代，因此在您的数据集中，您有一个分支，即“i”。

Λ
Λ→"i"

在“i”节点处，有两个子节点，一个代表“m”，一个代表“n”。下一个字母是“n”，所以你认为，

Λ→“i”→“n”

由于数据集中唯一以“i”、“n”开头的单词is“in”，没有来自“n”的孩子。那是一场比赛。

现在，假设数据集不是“in”，而是“infindibulum”。（我引用的 SF 留作练习。）您仍然会以相同的方式到达“n”节点，但是如果您得到的下一个字母是“q”，您就知道该单词不会出现在你的数据集中，因为没有“q”分支。那时，你会说“好吧，不匹配”。（也许你然后开始添加这个词，也许不是，这取决于应用程序。）

但如果下一个字母是“f”，您可以继续。不过，您可以用一点技巧来短路：一旦到达代表唯一路径的节点，您就可以将整个字符串离开该节点。当你到达该节点时，你知道字符串的其余部分must是“findibulum”，因此您使用了前缀来匹配整个字符串，然后返回它。

你怎么用它？在许多非 UNIX 命令解释器中，例如旧的 VAX DCL，您可以使用命令的任何唯一前缀。所以，相当于ls(1) was DIRECTORY，但没有其他命令以 DIR 开头，因此您可以输入DIR这与完成整个单词一样好。如果你记不住正确的命令，你可以只输入“D”，然后按（我认为）ESC； DCL CLI 会返回给你all以开头的命令D，它可以非常快地搜索。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基数树/patricia trie 中的前缀搜索的相关文章

在 C# 中按元素相乘数组具有意想不到的性能

我想找到按元素相乘两个数组的最佳方法这是更广泛项目的一部分其中性能而不是唯一的考虑因素我今天开始用 C Linqpad 编写一些函数因此它还没有以任何方式进行优化下面代码的输出如下 Environment ProcessorCou
FileStream 构造函数和默认缓冲区大小

我们有一个使用 NET 4 用 C 编写的日志记录类我想添加一个构造函数参数该参数可以选择设置文件选项 WriteThrough http msdn microsoft com en us library system io fileo
VS 程序在调试模式下崩溃，但在发布模式下不崩溃？

我正在 VS 2012 中运行以下程序来尝试 Thrust 函数查找 include cuda runtime h include device launch parameters h include
ASP.NET Web API 客户端 ProgressMessageHandler Post 任务卡在 WinForm 应用程序中

我在用着HttpClient and ProgressMessageHandler来自MS ASP NET Web API 客户端库 http nuget org packages Microsoft AspNet WebApi Clien
根据 N 个值中最小的一个返回不同的结果

不确定如何使标题更具描述性所以我只是从一个例子开始我使用下面的代码位它从枚举中选择一个方向具体取决于四个轴中哪一个与给定方向相比形成最小角度 static Direction VectorToDirection Vector2 di
指向特征矩阵的指针数组

我在代码中使用 Eigen 的 MatrixXd 矩阵在某个时刻我需要一个 3D 矩阵由于 Eigen 没有三维矩阵类型因为它仅针对线性代数进行了优化因此我创建了一个 MatrixXd 类型的指针数组 Eigen MatrixXd
找不到 assimp-vc140-mt.dll ASSIMP

我已经从以下位置下载了 Assimp 项目http assimp sourceforge net main downloads html http assimp sourceforge net main downloads html Ass
如何在 C# 控制台应用程序中将修饰符（ctrl、alt、shift）按键捕获为单个按键？

Console ReadKey 仅在按下正常键时捕获输入然后将修饰符如果有附加为键信息的一部分如何将单个修饰键注册为输入提供了一种解决方案这个链接 https blogs msdn microsoft com toub 200
动态生成的控件 ID 返回为 NULL

我可以在 Page PreInit 函数中创建动态控件如何检索控件及其 ID 我的 C 代码用于创建动态控件之一 var btn new WebForms Button btn Text btn ID Addmore btn Click
在常数空间中创建 1..N 的随机排列

我正在寻找枚举固定空间中数字 1 N 的随机排列这意味着我无法将所有数字存储在列表中原因是 N 可能非常大超过可用内存我仍然希望能够一次遍历这样一个数字的排列只访问每个数字一次我知道对于某些 N 可以这样做许多随机数生成器随机
检查 RoutedEvent 是否有任何处理程序

我有一个自定义 Button 类当单击它时打开特定窗口它总是执行相同的操作我添加了一个可以在按钮的 XAML 中分配的 Click 事件就像常规按钮一样当它被单击时我想执行 Click 事件处理程序如果已分配否则我想执行默
将二进制数据从 C# 上传到 PHP

我想将文件从 Windows C 应用程序上传到运行 PHP 的 Web 服务器我知道 WebClient UploadFile 方法但我希望能够分块上传文件以便我可以监控进度并能够暂停恢复因此我正在读取文件的一部分并使用 We
AES 输出是否小于输入？

我想加密一个字符串并将其嵌入到 URL 中因此我想确保加密的输出不大于输入 AES 是可行的方法吗不可能创建任何始终会创建比输入更小的输出的算法但可以将任何输出反转回输入如果您允许不大于输入那么基本上您只是在谈论同构算法alwa
如何在标准 WPF ListView 中启用 UI 虚拟化

我正在使用 NET 4 5 VS2012 并且我有一个 ListView 看起来像这样
运行选定的代码生成器时出错：“未将对象引用设置到对象的实例。”错误？

我已经尝试了所有解决方案例如修复 VS 2013 但没有用当您通过右键单击控制器文件夹来创建控制器并添加控制器时然后右键单击新创建的控制器的操作并选择添加视图当我尝试创建视图时就会发生这种情况它不是一个新项目而是一个现有项目
C# 中的 strstr() 等效项

我有两个byte 我想找到第二个的第一次出现byte 在第一个byte 或其中的一个范围我不想使用字符串来提高效率翻译第一个byte to a string会效率低下基本上我相信就是这样strstr 在 C 中做最好的方法是什么这
新任务中使用的依赖注入服务

我在需要时使用依赖项注入来访问我的服务但我现在想要创建一个并发任务但这会由于依赖项注入对象及其生命周期而导致问题我读过这篇文章标题防止多线程 Link http mehdi me ambient dbcontext in ef6
矩阵到数组 C#

这将是转换方阵的最有效方法例如 1 2 3 4 5 6 7 8 9 into 1 2 3 4 5 6 7 8 9 in c 我在做 int array2D new int 1 2 3 4 5 6 7 8 9 int array1D new
在简单注入器中解析具有自定义参数的类

我正在使用以下命令创建 WPF MVVM 应用程序简易注射器作为 DI 容器现在当我尝试从简单注入器解析视图时遇到一些问题因为我需要在构造时将参数传递到构造函数中而不是在将视图注册到容器时因此这不是适用的简单注入器将值传递到构造
将 char[][] 转换为 char** 会导致段错误吗？

好吧我的 C 有点生疏了但我想我应该用 C 来做我的下一个小项目这样我就可以对其进行抛光并且我已经有不到 20 行的段错误了这是我的完整代码 define ROWS 4 define COLS 4 char main map

随机推荐

如何将逗号分隔的数字字符串转换为整数数组？

说我有绳子1 2 3 4 5我想将其转换为整数数组最好的方法是什么我知道我可以使用爆炸来创建一个带有字符串的数组但我需要数组项是整数您可以使用array map申请intval分解字符串后的每个数组项 string 1 2 3 4
使用 scrapy 蜘蛛间歇性“getrandom() 初始化失败”

我构建了一个 scrapy 蜘蛛 scrapy 1 4 该蜘蛛是通过 django rq 和supervisord 从 django 网站按需触发的这是正在监听 django rq 事件的supervisord 作业 reddit 用作代
检索 ASP.NET 中的所有发布值

我正在创建一个 ASP NET 应用程序它允许用户将表单元素添加到表单内的页面当页面发布时通过提交按钮我需要循环遍历表单中所有发布的值并获取值我无法检查具体值因为我不知道会有多少个值或它们将被称为什么有人可以指出我获取所有发布
如何将数据集拆分/分区为训练和测试数据集，例如交叉验证？

将 NumPy 数组随机拆分为训练和测试验证数据集的好方法是什么类似的东西cvpartition or crossvalindMatlab 中的函数如果你想将数据集分成两部分你可以使用numpy random shuffle or
当需要相同类型的多个实例时，使用 Unity 进行 DI

我需要这方面的帮助我使用 Unity 作为容器并且想将同一类型的两个不同实例注入到我的构造函数中 class Example Example IQueue receiveQueue IQueue sendQueue IQueue 是在我
OrderedDict 在 Python 3.7 中会变得多余吗？

来自Python 3 7 变更日志插入顺序保存性质dict物体已宣布成为 Python 语言规范的正式部分这是否意味着OrderedDict会变得多余吗我能想到的唯一用途是保持与旧版本 Python 的向后兼容性旧版本的 Pytho
Boost::Asio，SSL 连接问题

我已经尝试解决我的问题几天了但就是无法解决我尝试使用 Boost Asio 库和 OpenSSL 进行 SSL 连接有一个示例代码如何做到这一点 http www boost org doc libs 1 55 0 doc html
如何使用selenium获取特定元素的html源？

我正在查看的页面包含 div p text 1 p h1 text 2 h1 text 3 p text 4 p div 我想获取 div 中的所有文本除了
阿特金分段筛可能吗？

我知道可以实现埃拉托斯特尼筛法以便它连续找到素数而没有上限分段筛我的问题是阿特金伯恩斯坦筛法可以用同样的方式实现吗相关问题 C 如何使阿特金筛增量然而相关问题只有1个答案即对于所有筛子都是不可能的这显然是不正确的 Atk
文件 InfoPlist.strings 无法打开

谁能帮帮我吗我应该如何修复错误无法打开文件 InfoPlist strings 因为没有这样的文件它是在我从 SVN 更新我的项目后出现的实际上我的项目中有 InfoPlist strings 我不知道为什么 Xcode 没有看到它
写入现有 Excel 文件

package jexcel jxl nimit import java awt Label import java io File import java io IOException import jxl Cell import jxl
删除数据表中的主键

有没有办法从数据表中删除主键或者有没有办法先删除 PK 的约束然后删除列本身 Thanks UPDATED dtTable Columns Add new System Data DataColumn PRIMARY KEY typeof
通过伪经典实例化掌握原型继承（JavaScript）

我正在尝试通过 JavaScript 使用继承来通过测试套件下面是我到目前为止的代码片段 var Infant function this age 0 this color pink this food milk Infant proto
将双精度型转换为 int

转换的最佳方法是什么double to an int 应该使用演员阵容吗如果您想要默认的向零截断行为则可以使用强制转换或者您可能想使用Math Ceiling Math Round Math Floor等等尽管之后你仍然需要演员阵
将字符串转换为日期时间（使用 SSIS）

我想将值 5 27 2013 16 42 37 490000 从平面文件 DT STR 读取插入到 SQL Server 表的列日期时间中如果我尝试在派生列中使用 DT DBDATE 或 DT DBTIMESTAMP 对其进行强制转
忽略 Xcode4 中的“属性不可用”警告

我在工具栏项中使用了很多自定义标识符这在 Xcode4 中很好但在构建项目时它给了我一堆警告属性不可用 Interface Builder 3 2 之前版本中的自定义标识符有没有办法在Xcode4中忽略这些警告当我搜索真正的
Chart.js 中饼图的点击事件

我有一个关于 Chart js 的问题我使用提供的文档绘制了多个饼图我想知道单击其中一个图表的某个切片是否可以根据该切片的值进行 ajax 调用例如如果这是我的data var data value 300 color F7464A
学习MFC编程的先决条件[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我懂一点 C 和 C 我现在正在处理的项目是大量的 MFC 编程有经验的人可以告诉我学习MFC的前提条件吗另外什么是最好的学习来源有什么特别
堆插入的 O(1) 平均情况复杂度的论证

索赔要求二进制堆的维基百科页面插入是 O logn 在最坏的情况下但平均 O 1 所需的操作数量仅取决于新元素必须上升到满足堆性质的层数因此插入操作的最坏情况时间复杂度为 O logn 但平均情况复杂度为 O 1 The 链接页面试图证
基数树/patricia trie 中的前缀搜索

我目前正在实现一个基数树帕特里夏特里无论你想怎么称呼它我想用它在功能严重不足的硬件上的字典中进行前缀搜索它应该或多或少像自动完成一样工作即 e 显示与键入的前缀匹配的单词列表我的实现是基于关于这篇文章但其中的代码不包括前缀搜索

基数树/patricia trie 中的前缀搜索

基数树/patricia trie 中的前缀搜索 的相关文章

随机推荐

热门标签

基数树/patricia trie 中的前缀搜索的相关文章