关于扩展KMP算法写的比较好的文章:
https://segmentfault.com/a/1190000008663857
例题:
题意:
每组给你两个字符串s1和s2,求s2的所有后缀在s1中出现的频率,频率再乘以对应的后缀的长度,累加。
思路:
我们将s1,s2字符串翻转,然后进行一次扩展KMP,得到extend数组,然后对extend数组上的每一个值进行等差数列计算,就是最后结果。
分析一下这样做为啥对:
通过观察,我们可以看到在未翻转之前,如果s2中abc在s1中存在,那么s2的后缀bc,c在s1中也必定存在。我们就是运用这个性质来计算的,我们对于extend计算是:extend[1]上的值:2*1+1*1,extend[3]:2*1+1*1,extend[5]:3*1+2*1+1*1,。累加就得出结果。
extend[1]上的值代表bc字符串在s1中存在一次,c字符串在s1中存在一次。(未翻转的s1的最后一组bc)
extend[3]上的值代表bc字符串在s1中存在一次,c字符串在s1中存在一次。(未翻转的s1的倒数第二组bc)
extend[5]上的值代表abc字符串在s1中存在一次,bc字符串在s1中存在一次,c字符串在s1中存在一次。(未翻转的s1的第一组abc)
代码:
#include<algorithm>
#include<iostream>
#include<limits.h>
#include<string.h>
#include<stdlib.h>
#include<stdio.h>
#include<cstdlib>
#include<cstring>
#include<cassert>
#include<string>
#include<cstdio>
#include<bitset>
#include<vector>
#include<cmath>
#include<ctime>
#include<stack>
#include<queue>
#include<deque>
#include<list>
#include<set>
#define MAXN 1000001
#define mod 1000000007
typedef long long ll;
using namespace std;
ll extend[MAXN],next1[MAXN];
int t;
char S[MAXN],T[MAXN];
void GetNext(int Tlen)
{
int a,p,j;
next1[0]=Tlen;
for(int i=1,j=-1;i<Tlen;i++,j--)
{
if(j<0||i+next1[i-a]>=p)
{
if(j<0)
{
j=0;
p=i;
}
while (p<Tlen&&T[j]==T[p])//这个地方为啥是p<len呢?因为在这个地方,p是S串的下标,j是T串的下标,但这个是求next数组的,所以S和T相等,p与len的距离只可能等于或者小于j与len的距离,不可能大于
{
p++;
j++;
}
next1[i]=j;
a=i;
}
else
next1[i]=next1[i-a];
}
}
void GetExtend(int Slen,int Tlen)
{
GetNext(Tlen);
int a,p,j;
for(int i=0,j=-1;i<Slen;i++,j--)
{
if(j<0||i+next1[i-a]>=p)
{
if(j<0)
{
j=0;
p=i;
}
while (p<Slen&&j<Tlen&&T[j]==S[p])
{
p++;
j++;
}
extend[i]=j;
a=i;
}
else
extend[i]=next1[i-a];
}
}
int main()
{
cin>>t;
while (t--)
{
scanf("%s%s",S,T);
memset(next1,0,sizeof(next1));
memset(extend,0,sizeof(extend));
int Slen=strlen(S);
int Tlen=strlen(T);
reverse(S,S+Slen);//将S字符串和T字符串倒置
reverse(T,T+Tlen);
GetExtend(Slen,Tlen);//只需要过一遍扩展KMP就可以。
ll sum=0;
for(int i=0;i<Slen;i++)
sum=(sum+((1+extend[i])*extend[i]/2)%mod)%mod;
cout<<sum<<endl;
}
}