Z 算法背后的直觉

2024-06-19

Z算法是一种复杂度为O(n)的字符串匹配算法。

一种用例是从字符串 B 中查找字符串 A 的最长出现次数。例如，"overdose" from "stackoverflow"将会"over"。您可以通过使用组合字符串调用 Z 算法来发现这一点"overdose#stackoverflow"（其中 # 是两个字符串中都不存在的某个字符）。然后，Z 算法将尝试将组合字符串与其自身进行匹配 - 并创建一个数组 z[]，其中 z[i] 给出从索引 i 开始的最长匹配的长度。在我们的例子中：

index  0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21
string o  v  e  r  d  o  s  e  #  s  t  a  c  k  o  v  e  r  f  l  o  w
z    (21) 0  0  0  0  1  0  0  0  0  0  0  0  0  4  0  0  0  0  0  1  0

该算法有很多代码实现和面向数学的解释，以下是一些不错的：

http://www.geeksforgeeks.org/z-algorithm-linear-time-pattern-searching-algorithm/ http://www.geeksforgeeks.org/z-algorithm-linear-time-pattern-searching-algorithm/ http://codeforces.com/blog/entry/3107 http://codeforces.com/blog/entry/3107

我可以看到how它有效，但我不明白why。这看起来几乎就像黑魔法。我有一种非常强烈的直觉认为这项任务应该完成O(n^2)，但这里有一个算法可以做到这一点O(n)

我也不觉得它完全直观，所以我认为我有资格回答。否则我只会说你不明白，因为你是个白痴，而且这肯定不是你希望的答案:-)

例证（引自解释）：

Correctness is inherent in the algorithm and is pretty intuitively clear.

所以，让我们尝试更直观......

首先，我猜测 O(n^2) 的常见直觉是这样的：对于长度为 N 的字符串，如果您被放置在字符串中的随机位置 i 且没有其他信息，则必须匹配 x (

然而，Z 算法充分利用了您从过去的计算中获得的信息。

让我们来看看。

首先，只要没有匹配项 (Z[i]=0)，您就会沿着字符串前进，每个字符进行一次比较，因此时间复杂度为 O(N)。其次，当您找到匹配的范围（在索引 i 处）时，技巧是使用先前的 Z[0...i-1] 进行巧妙的推导来计算该范围内的所有 Z 值在恒定时间内, 没有其他比较在该范围内。接下来的比赛将只在范围的右侧进行。

反正我是这么理解的，希望对你有帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

Z 算法背后的直觉的相关文章

寻找公共子集的算法

I have N number of sets Si of Numbers each of a different size Let m1 m2 mn be the sizes of respective sets mi Si and M
如何以最低的价格优化购物车？

我有一个我想买的物品清单这些商品由不同的商店提供价格也不同商店有单独的送货费用我正在寻找一种最佳的购物策略以及支持它的java库以最低的总价购买所有商品 Example 商品 1 在 Shop1 的售价为 100 美元在 Sh
使用递归返回嵌套列表中第二小的数字

我必须归还第二小的使用递归的 python 列表中的数字以及no loops 我所做的是创建一个辅助函数它返回列表中最小第二小的值的元组然后我只取tuple 1 in my second smallest func def s
如何实现n个元素的查找和插入操作的动态二分查找

这个想法是使用多个数组每个长度为 2 k 根据 n 的二进制表示来存储 n 个元素每个数组都是排序的不同的数组没有以任何方式排序在上述数据结构中 SEARCH是通过对每个数组进行一系列二分查找来进行的 INSERT 是通过一系列相同
确定一组日期的事件重复模式

我正在寻找一种模式算法或库它将采用一组日期并在退出时返回重复的描述即集合 11 01 2010 11 08 2010 11 15 2010 11 22 2010 11 29 2010 会产生类似十一月的每个星期一的结果有没有人以
从列表中选择项目以求和

我有一个包含数值的项目列表我需要使用这些项目求和我需要你的帮助来构建这样的算法下面是一个用 C 编写的示例描述了我的问题 int sum 21 List
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi
与多名推销员一起旅行的推销员？

我有一个问题已被有效地简化为具有多个推销员的旅行推销员问题我有一个要从初始位置访问的城市列表并且必须访问销售人员数量有限的所有城市我正在尝试想出一个启发式方法想知道是否有人可以帮忙例如如果我有 20 个城市有 2 名销售员我
从 2 个平面轮廓进行表面重建 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案有一类用于两个平面轮廓之间的三角测量的算法这些算法尝试进行良好的三角测量来填充这些轮廓之间的空间其中之一基于动态规划技术并使用成本函
D3.js 对力导向图使用什么算法？

我有兴趣确切地知道 D3 使用什么算法来实现库中的力导向图功能读过科布罗夫的总结 http www cs brown edu rt gdhandbook chapters force directed pdf力导向图的历史让我有点困惑不
埃拉托色尼筛法的 Java 实现可以超过 n = 2^32？

目前我有这个质数生成器其限制为 n Sieve public class Main public static void main String args long N 2000000000 initially assume all in
什么是日历队列？

我正在致力于构建一个离散事件模拟器维基百科提到有几种通用优先级队列非常适合在 DES 中使用具体来说它提到日历队列是一个很好的结构我找到了一份 pdf 1988 年的其中提到了日历队列但在大多数情况下我找不到关于它们的任何其他内
解决复发问题

我被给予F 0 X and F i A F i 1 2 B F i 1 C 1000000 for 1 i N 现在给出N A B C and X 如何找到所有N元素有效吗我需要将这 N 个元素分成 2 个集合其中最大的元素在第一个集合
O(log n) 总是比 O(n) 快吗

如果有 2 种算法以不同的复杂度计算相同的结果 O log n 总是会更快吗如果是这样请解释一下顺便说一句这不是作业问题不会如果一种算法运行在N 100另一个在 log N 100 那么对于较小的输入大小第二个将会较慢渐近复杂
Java 服务器和浏览器客户端之间乐观对象复制的解决方案？

我正在构建一个系统多个用户需要同时创建查看和修改一组对象该系统计划在 Java 服务器和现代浏览器客户端上运行我可以选择哪些它需要在网络和服务器中断时具有鲁棒性用户界面不得阻止修改修改需要存储在本地并在连接恢复时发布在正常操
无限循环：确定并打破无限循环

你如何判断一个循环是无限循环并且会跳出它有没有人有算法或者可以帮助我解决这个问题 Thanks 没有通用的算法可以确定程序是否处于无限循环中图灵完备 http en wikipedia org wiki Turing completene
如何编写一个简单的版本控制系统？

我想做一个简单的版本控制系统但我不知道如何构建我的数据和代码这是一个简短的例子用户登录 User has two options when uploading a file 提交新文件提交文件的新版本用户应该能够看到树版本不同
哪种算法可以解决我的婚礼餐桌问题？

我的婚礼有 x 位客人有 y 张桌子有 z 个座位客人A可以与客人B同桌客人C不能与客人D同桌给定所有客人之间所有连接的数据集是否有已知的算法可以解决此类问题我确信这种问题有一个抽象的父问题称为问题 x 或其他问题或者它
高效找到圆和网格的交点

找到由圆心和半径定义的圆与任意网格的交点的好方法是什么 An illustration of the points I am trying to find 到目前为止我想到的可能的解决方案找到位于中心半径之间的所有线对于每条线计算交点
如何找到权重为 1、0、-1 且成本精确为 0 的多维路径

我得到了一个有向图其中有 n 个节点和边向量的权重每个向量的长度为 m 为数字 1 0 1 我想找到从一个节点到另一个节点我们可以多次访问节点的任何路径或者说这样的路径不存在使其权重之和等于仅由零组成的向量我正在考虑暴力回溯

随机推荐

NSString keepCount 是 2147483647 [重复]

这个问题在这里已经有答案了可能的重复 NSString 保留计数 https stackoverflow com questions 1390334 nsstring retain count Objective C NSString 属
方向改变时重新定位控件

我知道自动布局可用于在方向改变时使尺寸和位置保持一致当方向改变时是否可以完全改变布局例如请查看下面的纵向模式下简单登录屏幕的线框现在如果我旋转设备我想完全重新定位控件这种事情可以用自动布局来完成吗如果没有我该怎么办谢谢
显然不明确的调用不会导致GCC上的编译错误

我对 GCC 这样做感到惊讶not考虑调用foo 在下面的程序中存在歧义 include
如何解决 xcode 一直编译所有内容的问题？

我已经开始使用 XCode 它似乎可以工作嗯大部分烦人的是它每次都会编译所有源文件甚至是那些没有更改的文件我正在掌握 openframeworks 每次都浪费时间编译 openframeworks 源文件尽管它们没有改变以下是
Unity 4.3 - 2D，如何以编程方式将精灵分配给对象

我正在尝试创建一个对象该对象将负责创建和显示不同的精灵因此我想以编程方式直接访问资产精灵而不是在该对象下的层次结构中拖放精灵有没有一种方法可以以编程方式创建一个新的精灵并分配我在资产文件夹中拥有的内容我还想要一种数据结构其中在
angularjs ng-repeat 在两个级别上但只有一个输出

我有一个看起来像这样的大物体 scope marketplaces first example second example 我想做的是循环遍历大对象如下所示 section ul li li ul section 在循环内部再次循环每
如果通过谓词则返回值，否则返回默认值

如果某个值未通过谓词我该如何替换它为了显示 assert eq 3 5 but if v v lt 0 then 0 0 我以为会有一些东西Option or Result允许这样做但我找不到它我以为会有一些东西Option or
将控制器操作处理为 JS 而不是 HTML

所以我有以下形式 Follow 我试图
iOS推送通知：当应用程序处于后台时，如何检测用户是否点击了通知？

关于这个主题有很多 stackoverflow 线程但我仍然没有找到好的解决方案如果应用程序不在后台我可以检查launchOptions UIApplicationLaunchOptionsRemoteNotificationKey
实现与扩展：何时使用？有什么不同？

请用易于理解的语言进行解释或提供某些文章的链接 extends is for 延伸一类 implements is for 实施一个接口接口和常规类之间的区别在于在接口中您不能实现任何声明的方法只有实现接口的类才能实现方法 C 中
使用 JSON 文件动态更新 HTML 内容？

我想创建一个 JS 循环使用 jQuery 来查看 JSON 文件并根据是否 div ids 与 JSON id 值匹配这需要易于扩展并且无论有多少人都可以工作 div 添加了盒子我有一个 HTML 文件设置如下 div clas
导入错误：无法导入名称“FFProbe”

我无法获取ffprobe包 https github com simonh10 ffprobe在 Python 3 6 中工作我使用 pip 安装它但是当我输入import ffprobe it says Traceback most
TestNG并行执行

我有 4 个 Test 方法并且想每个方法运行 3 次我想在 12 个线程中同时执行这一切我创建了一个像这样的 testng xml 文件
C#：DataSet.readXML( "filepath" ) 如何处理包含对象内对象内对象的 XML 文件？

我有一个 xml 文件格式如下
如何同时支持 IPv4 和 IPv6 连接

我目前正在开发 UDP 套接字应用程序需要构建支持以便 IPV4 和 IPV6 连接可以将数据包发送到服务器我希望有人能帮助我并为我指明正确的方向我发现的大部分文档都不完整如果您能指出 Winsock 和 BSD 套接字之间的任何
如何在 Meteor 应用程序之间共享 MongoDB 集合？

我希望能够为我的项目提供一个管理应用程序和一个客户端应用程序理想情况下我希望能够拥有一个共享的 MongoDB 集合我怎样才能做到这一点我尝试在两个不同的应用程序中创建具有相同名称的集合但发现 Meteor 会将数据分开知道我能
使用非英语的通用语言？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案在讨论最近项目的规范和功能要求时我们正在与领域专家讨论荷兰语的会计术语因为整个团队和客户都是以荷兰语为母语的人当开发开始时我们很自然地用英语实
com.android.ddmlib.AdbCommandRejectedException：设备离线（即使设备已连接）

将 Android Studio 更新到 2 1 2 后当我进行更改时我多次收到以下错误 com android ddmlib AdbCommandRejectedException 设备离线安装 APK 时出错问题是设备从未连接且
CSS：多属性选择器

我想设置电子邮件和密码类型的表单输入样式但不设置其他任何样式我正在想象类似以下的事情 input type email type password 然而属性选择器的工作方式似乎将其解释为输入其中类型同时是电子邮件 and
Z 算法背后的直觉

Z算法是一种复杂度为O n 的字符串匹配算法一种用例是从字符串 B 中查找字符串 A 的最长出现次数例如 overdose from stackoverflow 将会 over 您可以通过使用组合字符串调用 Z 算法来发现这一点 ove

Z 算法背后的直觉

Z 算法背后的直觉 的相关文章

随机推荐

热门标签

Z 算法背后的直觉的相关文章