给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
- 数据0:小规模字符串,测试基本正确性;
- 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
- 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
- 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
- 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
- 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
- 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
在正式码代码之前,对于kmp算法,有些概念我们要清晰:
KMP算法是什么? 对于暴力匹配到底有哪些改进?
答:暴力在刚才匹配的过程中,主串指针回溯了2次,才达到匹配的状态kmp算法,主串指针没有回溯,并且快速达到了匹配状态。
kmp是一种高效的模式匹配算法,它牺牲了一定的空间去保存next数组,提高了我们的匹配效率。kmp算法还能更加智能的移动字符串,让字符串达到匹配状态。
kmp算法的核心:Next数组,算法:公共前后缀
next数组是什么?
是当该字符与主串发生不匹配之后,值对应索引的字符要移动到跟主串不匹配的字符对齐。
算法:公共前后缀
前面和后面一样的。
找公共前后缀的目的是什么?
为了找到前后能够匹配的状态
next值=公共前后缀+1
推荐一些bilibili up主的视频讲解:(众所周知,bilibili是一个学习平台)
KMP算法计算next函数值(教材版,超简单!)https://www.bilibili.com/video/BV12J411m74v?from=search&seid=15357718169736296010&spm_id_from=333.337.0.0 「天勤公开课」KMP算法易懂版https://www.bilibili.com/video/BV1jb411V78H?from=search&seid=15357718169736296010&spm_id_from=333.337.0.0
KMP算法之求next数组代码讲解https://www.bilibili.com/video/BV16X4y137qw?from=search&seid=15357718169736296010&spm_id_from=333.337.0.0
PS:建议按照所给顺序学习
代码段:
#include <iostream>
#include <stdlib.h>
#include <string.h>
using namespace std;
int* getNext(char *s)
{
int len = strlen(s);
int *next = (int*)malloc(sizeof(int)*len);
int i=0; //字符串从0开始
int j=-1; //j为next数组的值,因字符串从0开始,所以j从-1开始为了与字符串位置相对应
next[i]=j; //第一个字符的next数组值恒为-1
while(i<len-1) //next[0]已经赋值,所以循环len-1次
{
if(j==-1 || s[i]==s[j])
{
i++;
j++;
next[i]=j;
}else j=next[j];
}
return next;
}
int kmpMatch(char *String,char *Pattern,int *next)
{
int i=0;
int j=0;
int lenString = strlen(String);
int lenPattern = strlen(Pattern);
while(i< lenString && j< lenPattern)
{
if(j==-1 || String[i] == Pattern[j]) // j=-1代表Pattern从头开始匹配
{
i++;
j++;
}else{
j=next[j];
}
}
if(j==lenPattern) //代表成功匹配
return i-j; //返回位置
else return -1;
}
void StringPrint(char *s,int index) //为了输出成功匹配后的字符串
{
int i=index;
while(s[i])
{
cout<<s[i];
i++;
}
cout<<endl;
}
int main()
{
int N,index;
char *String , *Pattern;
String = (char*)malloc(sizeof(char)*10e6);
Pattern = (char*)malloc(sizeof(char)*10e5);
cin>>String;
cin>>N;
for(int i=0;i<N;i++)
{
cin>>Pattern;
int *next = getNext(Pattern);
index=kmpMatch(String,Pattern,next);
if(index==-1)
{
cout<<"Not Found"<<endl;
}else{
StringPrint(String,index);
}
}
return 0;
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)