KMP算法原理

2023-10-29

所有下标从0开始

子串的定位操作通常称为串的模式匹配，它求的是子串(或称模式串)在主串中的位置。

前缀：除最后一个字符外，字符串的所有头部子串。
后缀：除第一个字符外，字符串的所有尾部子串。
部分匹配值：字符串的前缀和后缀的最长相等前后缀长度。

字符串	前缀	后缀	部分匹配值
a	{}	{}	0
ab	{a}	{b}	0
aba	{a, ab}	{a, ba}	1
abab	{a, ab, aba}	{b, ab, bab}	2
ababa	{a, ab, aba, abab}	{a, ba, aba, baba}	3

暴力匹配O(mn)：匹配失败后，模式串指针j回退到初始位置(0)，主串指针i回退到本轮匹配初始位置的下一个位置(3 + 1=4)。
KMP算法O(m+n)：根据模式串中已成功匹配子串(abcab)的特点，不需要全部回退，i保持不动，j回退到已成功匹配子串的最长相等前缀的下一个位置即可(ab后面的c的位置，即下标2)。因此，我们可以建立一个和模式串等长的数组next，存储j位置匹配失败时j的下一个位置。next[j]的值为pattern[1 ~ j-1]的部分匹配值，即最长相等前缀或最长相等后缀的长度。

采用数学归纳法：

next[0] = -1; // 模式串第0个匹配失败，i不动，赋值j=-1，则++i;++j后等效于模式串第0个字符与主串下一个字符相比。

设next[i] = j;

则pattern[0 ~ i-1]中，最长相等前缀为pattern[0 ~ j-1]，最长相等后缀为pattern[i-j ~ i-1]；

因此，pattern[0~i]最长相等前后缀只需比较 pattern[0 ~ j] 和 pattern[i-j ~ i] 即可(最长相等前后缀各向后扩一个)。

// pattern[0~i] 可能达到的 最长相等前后缀 即为 pattern[0 ~ j] 和 pattern[i-j ~ i]，要求pattern[j] == pattern[i]
// 若pattern[j] != pattern[i]，则问题转变为 pattern[0 ~ j]为模式串 和 pattern[i-j ~ i]为主串的 匹配问题
// (pattern[0 ~ j-1] 和 pattern[i-j ~ i-1]已成功匹配，且pattern[j] != pattern[i]，则模式串 指针 应该根据next数组前跳)

while (j !=-1 && pattern[i] != pattern[j])
	j = next[j]; // j < i，next[i]之前即next[0 ~ i-1]已求得
next[i + 1] = j + 1;

还有一个问题，text[i]和pattern[j]匹配失败，j=next[j]，新的pattern[j]或和老的pattern[j]相等，则又要重新跳转，因此，我们应该保证pattern[j] != pattern[next[j]]

while (j !=-1 && pattern[i] != pattern[j])
	j = next[j]; // j < i，next[i]之前即next[0 ~ i-1]已求得
if (pattern[i + 1] == pattern[j + 1])
    next[i + 1] = next[j + 1]; // 不用递归跳转，因为next是依次加入的，若 pattern[j + 1] == pattern[next[j + 1]]，则将跳转使得其不相等，所以pattern[i+1]不可能连续等于pattern[j + 1]和pattern[next[j + 1]]
else
	next[i + 1] = j + 1;

import java.util.Random;

public class Main {

    // 生成随机字符串
    public static String randomString(String range, int length) {
        Random random=new Random();
        StringBuffer sb=new StringBuffer();
        for (int i = 0; i < length; i++) {
            sb.append(range.charAt(random.nextInt(range.length())));
        }
        return sb.toString();
    }

    public static void main(String[] args) {
        for (int i = 0; i < 1000; i++) {
            String text = randomString("abcdefg", 1000);
            String pattern = "abc";

            int ref = text.indexOf(pattern);
            int out = indexOf(text, pattern);
            int kmp = indexOfByKMP(text, pattern);

            System.out.printf("ref: %10d, out: %10d, kmp: %10d\n", ref, out, kmp);
            assert ref == out;
            assert ref == kmp;
        }
    }

    // 暴力匹配
    public static int indexOf(String text, String pattern) {
        int i = 0, j = 0;
        while (i < text.length() && j < pattern.length()) {
            if (text.charAt(i) == pattern.charAt(j)) {
                ++i;
                ++j;
            } else {
                i = i - j + 1;
                j = 0;
            }
        }
        if (j == pattern.length())
            return i - pattern.length();
        else
            return -1;
    }

    private static int[] getNext(String pattern) {
        int[] next = new int[pattern.length()];

        int i = 0, j = -1;
        next[i] = j;

        while (i < pattern.length() - 1) {
            if (j != -1 && pattern.charAt(i) != pattern.charAt(j))
                j = next[j];
            ++i;
            ++j;
            if (pattern.charAt(i) == pattern.charAt(j))
                next[i] = next[j];
            else
                next[i] = j;
        }

        return next;
    }

    // KMP算法
    public static int indexOfByKMP(String text, String pattern) {
        int[] next = getNext(pattern);

        int i = 0, j = 0;
        while (i < text.length() && j < pattern.length()) {
            if (j == -1 || text.charAt(i) == pattern.charAt(j)) {
                ++i;
                ++j;
            } else {
                j = next[j];
            }
        }
        if (j == pattern.length())
            return i - pattern.length();
        else
            return -1;
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

KMP算法原理的相关文章

将 jar 作为 Linux 服务运行 - init.d 脚本在启动应用程序时卡住

我目前正在致力于在 Linux VM 上实现一个可运行的 jar 作为后台服务我已经使用了找到的例子here https gist github com shirish4you 5089019作为工作的基础并将 start 方法修改为
禁用 Eclipse Java 调试器的热代码替换 [重复]

这个问题在这里已经有答案了可能的重复如何在 Eclipse 中禁用热代码替换 https stackoverflow com questions 2594408 how do i disable hot code replace in
为什么 java 编译器不报告 Intellij 中多播表达式的未经检查的强制转换警告？

为什么下面的代码没有报告 Intellij IDEA 的未经检查的警告jdk 1 8 0 121自从Supplier
使用 RecyclerView 适配器在运行时更改布局屏幕

我有两个布局文件如下所示如果列表中存在数据则我显示此布局当列表为空时我会显示此布局现在我想在运行时更改布局当用户从列表中删除最后一项时我想将布局更改为第二张图片中显示的空购物车布局 In getItemCount Recy
在 HTTP 标头中发送 UTF-8 值会导致 Mojibake

我想使用 servlet 发送阿拉伯语数据HTTPServletResponse给客户我正在尝试这个 response setCharacterEncoding UTF 8 response setHeader Info arabicWo
无法在 Spring Boot 测试中模拟 persistenceContext

我正在使用带有 Mockito 框架的 spring boot 测试来测试我的应用程序存储库类 EntityManager 之一作为参考我的班级如下所示 Repository Transactional Slf4j public cla
主线程如何在该线程之前运行？

我有以下代码 public class Derived implements Runnable private int num public synchronized void setA int num try Thread sleep 1
Java 服务器-客户端 readLine() 方法

我有一个客户端类和一个服务器类如果客户端向服务器发送消息服务器会将响应发送回客户端然后客户端将打印它收到的所有消息例如如果客户端向服务器发送 A 则服务器将向客户端发送响应 1111 所以我在客户端类中使用 readLine 从服
获取给定类文件的目录路径

我遇到的代码尝试从类本身的 class 文件所在的同一目录中读取一些配置文件 File configFiles new File this getClass getResource getPath listFiles new Filenam
计算日期之间的天数差异

在我的代码中日期之间的差异是错误的因为它应该是 38 天而不是 8 天我该如何修复 package random04diferencadata import java text ParseException import java t
如何通过 Inno Setup for NetBeans 使用自定义 .iss 文件

我将 Inno Setup 5 与 NetBeans 8 一起使用并且我已经能够创建一个安装程序来安装该应用程序C users username local appname 但是我希望将其安装在C Programfiles 我如何在 Ne
如何在Java中正确删除数组[重复]

这个问题在这里已经有答案了我刚接触 Java 4 天从我搜索过的教程来看讲师们花费了大量精力来解释如何分配二维数组例如如下所示 Foo fooArray new Foo 2 3 但我还没有找到任何解释如何删除它们的信息从内存的情
Java：拆箱整数时出现空指针异常？

此代码导致空指针异常我不知道为什么 private void setSiblings PhylogenyTree node Color color throws InvalidCellNumberException PhylogenyTr
JSON 到 hashmap (杰克逊)

我想将 JSON 转换为 HashMapJackson http jackson codehaus org 这是我的 JSON String json Opleidingen name Bijz trajecten zorg en welz
Android AutoCompleteTextView 带芯片

我不确定我是否使用了正确的词语来描述此 UI 功能但我已附上我希望在我的应用程序中实现的目标的快照它由 Go SMS 使用用户在编辑文本中键入联系人在用户从完成下拉列表中选择联系人后该联系人将被插入到编辑文本中如附图所示编辑文
在android中跟踪FTP上传数据？

我有一个运行 Android 的 FTP 系统但我希望能够在上传时跟踪字节这样我就可以在上传过程中更新进度条安卓可以实现这个功能吗现在我正在使用org apache common net ftp我正在使用的代码如下另外我在 A
Java &= 运算符应用 & 或 && 吗？

Assuming boolean a false 我想知道是否这样做 a b 相当于 a a b logical AND a is false hence b is not evaluated 或者另一方面这意味着 a a b Bitwi
JAXB - 列表<可序列化>？

我使用 xjc 制作了一些课程 public class MyType XmlElementRefs XmlElementRef name MyInnerType type JAXBElement class required false
在哪里存储 Java 的 .properties 文件？

The Java教程 http download oracle com javase tutorial essential environment properties htmlon using Properties 讨论如何使用 Prop
Android 和 Java 中绘制椭圆的区别

在Java中由于某种原因Ellipse2D Double使用参数 height width x y 当我创建一个RectF在Android中参数是 left top right bottom 所以我对适应差异有点困惑如果在 Java 中创

随机推荐

verdaccio内网离线搭建npm私有仓库

使用场景前端项目的编译运行开发中报下载经常出错项目场景通常我们前端项目开发搭建过程中通过npm管理前端js库新建项目或内网开发过程中经常出现环境搭建的问题例如常见错误Failed at the chromedriver 2 37
QT学习一：利用QT QAxObject读取Excel表格数据的两种方法比较

目录 QAxObject QVariant 1 逐单元格读取表格内容 2 一次性读取工作表使用范围利用QT的 QAxObject读取Excel表格数据的两种方法比较完整的QT源码到此下载 ReadExcel rar 嵌入式文档类资源 C
计算机视觉与深度学习-经典网络解析-VGG-[北邮鲁鹏]

目录标题 VGG 参考 VGG网络贡献使用尺寸更小的 3 times 3 卷积串联来获得更大的感受野放弃使用 11 times 11 和 5 times 5 这样的大尺寸卷积核深度更深非线性更强网络的参数也更少去掉了AlexNe
黑马并发编程JUC总结

并发编程总结1 并发编程 2 进程和线程 2 1定义 2 2并发和并行 2 3应用异步调用并发应用 3 java线程 3 1线程创建创建线程方法1 创建方法2 Thread和Runable的区别创建方法3 3 2线程运行 3 3线程
[Coursera 数字图像和视频处理基础]第一周

开始跟Coursera上的数字图像和视频处理基础这门课这次学习笔记记录下第一周的学习内容第一周的内容很少介绍了一些非常基础的知识概括如下并且记录了最后的答题作业课程主页截图 1 模拟VS数字信号首先是信号的定义我搜了一点资料
稠密连接网络（DenseNet）

ResNet极大地改变了如何参数化深层网络中函数的观点稠密连接网络 DenseNet Huang et al 2017 在某种程度上是ResNet的逻辑扩展让我们先从数学上了解一下 1 从ResNet到DenseNet 回想一下任意函数
python: 字典 (dict) 的使用

摘要在刷 leecode 的题目时会经常使用哈希表在 python 中称为字典 dict 由于本人平时不怎么多使用字典在真正运用时经常忘记其常规用法特别是其成员函数的使用因此本人根据自己在刷 leecode 时经常使用字典的方
Memcache查看列出所有key方法

Memcached查看列出所有key方法测试的过程中发现Memcached没有一个比较简单的方法可以直接象redis那样keys 列出所有的Session key 并根据key get对应的session内容具体操作如下登录MemC
bugkuctf-Simple_SSTI_2

方法一 tplmap 直接扫 python2 tplmap py u http 114 67 175 224 10589 flag 可以注入使用 os shell提权 python2 tplmap py u http 114 67 175
7.recurrent_neural_network

device torch device cuda if torch cuda is available else cpu sequence length 28 input size 28 hidden size 128 num layers
windows环境与Linux环境下调用c++程序

在此之前需要在java编译软件IDEL中配置本地的Maven仓库等可自行网上搜索配置一在Windows系统下调用c 软件生成的dll文件 1 在IDEL中创建Maven工程配置下载jna包等在pom文件中写入如下配置即可
软件测试2019：第三次作业

一单元测试的任务有哪些 1 模块接口测试 2 模块局部数据结构测试 3 模块边界条件测试 4 模块中所有独立执行通路测试 5 模块的各条错误处理通路测试二代码评审方法有哪些你认为哪一种比较有效理由是什么代码评审方法分为代码走查和
什么时候开始使用Redis

思考这个问题的本质就是要学会取舍和选型技术选型非常重要大多人为了技术而技术这是不可取的就想小彬认为微服务必须解决分布式事务一样但他却不知道为什么要用分布式事务从而不知道什么时候要用分布式事务就想Redis一样什么时候要用Re
jmap 文件解析_干货分享丨jvm系列：dump文件深度分析

摘要 java内存dump是jvm运行时内存的一份快照利用它可以分析是否存在内存浪费可以检查内存管理是否合理当发生OOM的时候可以找出问题的原因那么dump文件的内容是什么样的呢 JVM dump java内存dump是jvm运行
【springboot】如何在自己的springboot项目中引用别的springboot项目jar

正好今天碰到了就在这里总结下习惯了将公用的项目打包成jar 然后当做工具类引入到自己项目中直接调用感觉甚是方便但有没有发现平时我们引用的大部分情况下是一个maven项目然后打包好的jar也是maven项目的结构所以我们可以正
VS使用技巧汇总

总目录文章目录总目录前言一快捷技巧 1 代码片段快捷方式 2 选择性粘贴 3 快速停靠窗口 4 多行同步快速编辑 5 引用命名空间 6 整行上下移动 7 快捷键二 VS功能 1 打开VS自带反编译 2 VS扩展插件三其他总
win10远程登录Ubuntu14.04图形化界面

一使用场景因工作原因需要在window与Linux系统同时操作由于虚拟机卡顿十分影响工作效率于是找领导又申请一台电脑 Ubuntu主机主要日常代码编译与git操作 window主机主要用于日常沟通资料查询测试研发 windo
go语言重大bug，make缓存读取数据漏洞，4096漏洞

做一个小程序需要对文件内容分片读取但是读取过程中发现数据读取不全经测试多个make缓存读取文件时发现问题以下为漏洞测试部分一生成测试文件 AAA txt 创建一个AAA txt文件写入1万个A wFile os OpenFil
KMP算法原理

所有下标从0开始子串的定位操作通常称为串的模式匹配它求的是子串或称模式串在主串中的位置前缀除最后一个字符外字符串的所有头部子串后缀除第一个字符外字符串的所有尾部子串部分匹配值字符串的前缀和后缀的最长相等前后缀长度字

KMP算法原理

KMP算法原理 的相关文章

随机推荐

热门标签

KMP算法原理的相关文章