转载请注明出处:http://blog.csdn.net/u012860063?viewmode=contents
如果一个长度 L 字符串是由 n 个长度 L / n 子串构成的。那么最后一个字符的next值是L-L/n吧;
例如:
一个字符串:abbabbabbabbabb(一共15个字符)
next[15]=12吧!
我们拿:15 – 12 = 3 就是最长重复子串的长度
现在说一般情况:
假设 next[length] = k
如果 k % length == 0 那 length / k 就是最长重复子串长度;
如果 k 不能整除 length 那最长重复子串就是它自己了。
KMP,next[]表示模式串如果第i位(设T[0]为第0位)与文本串第j位不匹配,则要回到第next[i]位继续与文本串第j位匹配。则模式串第1位到next[n]与模式串第n-next[n]位到n位是匹配的。所以思路和上面一样,如果n%(n-next[n])==0,则存在重复连续子串,长度为n-next[n]。
例如: a b a b a b
next: -1 0 0 1 2 3 4
next[n] == 4代表着:前缀abab与后缀abab相等的最长长度,这说明,ab这两个字母为一个循环节,长度 = n-next[n];
求next[]值的代码如下:
#include<cstdio>
#include<cstring>
#define N 1000017
int next[N];
int len;
void getnext(char T[])
{
int i = 0, j = -1;
next[0] = -1;
while(i < len)
{
if(j == -1 || T[i] == T[j])
{
i++;
j++;
next[i] = j;
}
else
j = next[j];
}
}
int main()
{
char s[N];
while(~scanf("%s",s))
{
len = strlen(s);
getnext(s);
for(int i = 1; i <= len; i++)
{
printf("%d ",next[i]);
}
printf("\n");
}
return 0;
}
实例运用见:http://blog.csdn.net/u012860063/article/details/38532507