对于一个字符串,判断其是否是另一个字符串的子串,朴素的想法是逐字对照,然后判是否成立。这种算法最差要O(n^2)的时间复杂度,于是我们想到优化:KMP算法。
K(an)M(ao)P(ian)算法对于处理此类问题十分简洁,代码也不长,很容易实现。时间复杂度可以控制在O(n)以内
具体的思路如下
我们需要构造一个失配函数来存储匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。
实现代码如下
#include<bits/stdc++.h>
using namespace std;
char t[1000050],p[1000050];
int f[1000050];
void getfail(char* p,int* f){
int m=strlen(p);
f[0]=0,f[1]=0;
for(int i=1;i<m;i++){
int j=f[i];
while(j&&p[i]!=p[j]) j=f[j];
f[i+1]=p[i]==p[j]?j+1:0;
}
}
void findit(char* t,char* p,int* f){
int n=strlen(t),m=strlen(p);
getfail(p,f);
int j=0;
for(int i=0;i<n;i++){
while(j&&p[j]!=t[i]) j=f[j];
if(p[j]==t[i]) j++;
if(j==m) printf("%d\n",i-m+2);
}
}
int main(){
scanf("%s",t);
scanf("%s",p);
findit(t,p,f);
for(int i=1;i<=strlen(p);i++) printf("%d ",f[i]);
return 0;
}