题目:KMP字符串匹配
资料:SYC大佬的博客
思路:
nxt[i] :字符串0~i的最长相等的前缀后缀长减1,也就是最长相等前缀后缀中的前缀的结束位置。
比如从i开始查找到j处时不匹配,nxt[j]=2,也就是说A段和B段完全相等,因为A是X串的前缀,那么B也是X串的前缀,可以直接从B段开始匹配:
i j
↓ ↓
XX XX XX XX XX XX
YY YY YY YY YY
| A | | B |
update in 2018/10/26 :
天哪我竟然没看模板就敲出来了……
感觉这一版代码好看多了呢……
不同的是这一版代码的nxt数组最长相等的前缀后缀长,不用减一,同时两个字符串都从1开始编号。
代码:
2018/10/26版
#include<bits/stdc++.h>
using namespace std;
#define maxn 1000000
#define maxm 1000000
char a[maxn+5],b[maxn+5];
int n,m;
int nxt[maxn+5];
int main() {
scanf("%s%s",a+1,b+1);
n=strlen(a+1),m=strlen(b+1);
nxt[1]=0;
for(int i=2;i<=m;i++) {
int j=nxt[i-1];
while(b[i]!=b[j+1]&&j>0) {
j=nxt[j];
}
if(b[i]==b[j+1]) nxt[i]=j+1;
else nxt[i]=0;
}
int j=1;
for(int i=1;i<=n;i++) {
while(b[j+1]!=a[i]&&j>0) {
j=nxt[j];
}
if(b[j+1]==a[i]) j++;
if(j==m) printf("%d\n",i-m+1);
}
for(int i=1;i<=m;i++) printf("%d ",nxt[i]);
return 0;
}
2018/08/12版
#include<bits/stdc++.h>
using namespace std;
#define maxn 1000000
char a[maxn+5],b[maxn+5];
int lena,lenb;
int nxt[maxn+5];
int main() {
scanf("%s%s",&a,&b);
lena=strlen(a),lenb=strlen(b);
nxt[0]=-1;
for(int i=1; i<lenb; i++) {
int j=nxt[i-1];
while(b[j+1]!=b[i]&&j>=0) {
j=nxt[j];
}
if(b[j+1]==b[i]) nxt[i]=j+1;
else nxt[i]=-1;
}
int i=0,j=0;
while(i<lena) {
if(a[i]==b[j]) {
i++,j++;
if(j==lenb) printf("%d\n",i-j+1);
} else {
if (j==0) i++;
else j=nxt[j-1]+1;
}
}
for(int i=0;i<lenb;i++){
printf("%d ",nxt[i]+1);
}
return 0;
}