面向考研——计算KMP算法中的next数组和nextval数组

KMP算法中,如何手动求next数组和nextval数组?

首先我们要理解next数组的意义,为了实现更加高效的字符匹配,next数组是用来寻找字符串数组内部的自身的一种规律,利用字符串内部的一种相似性,来优化字符串数组匹配算法。所以才需要计算这么一个next数组来帮助算法更好的实现字符串匹配。

next数组的计算方式逻辑上稍微复杂,初学者可能很难看懂,所以首先要理解,为什么要计算next数组以及更加优化的nextval数组。

假如有这样一串字符串

1 2 3 4 5 6

a a a a a a

这可以说是一个字符串间规律最强的一个数组了吧,让我们来手动模拟一下。

首先默认第一位是0,第二位是1,从第3位开始求,比较第3-1位和next[3-1]的字符是否相同,若相同,则next[3]=next[2]+1

所以第3位的值就是2.那么依此类推就可以得到,这个字符串的next数组为

1 2 3 4 5 6

a a a a a a

0 1 2 3 4 5

总结来看就是相同就在他的next数组值加1.

那么有这样一个字符串那

1 2 3 4 5 6

a b c d e f

默认给出第1位为0 第二位为1 ,发现全都不一样,可以说毫无相关性了,所以next数组为

1 2 3 4 5 6

a b c d e f

0 1 1 1 1 1

这两种极端情况可以让大家初步了解一下计算next数组的方法,起码可以初步理解一下next数组的意义。但是这还不完善。

下面介绍一到北邮2016年考研真题

1 2 3 4 5 6 7 8

a b a a b c a c

0 1 1 2 2 3 1 2

这是一个考试常见的字符串,是如何计算的那?

第n位:next[n]的值来自于第n-1位的字符,通过跟第next[n-1]位字符比较,如果相同next[n]=next[n-1],如果不相同,就跟第next[next[n-1]]位的字符比较,就这样迭代直到相同的时候,加上1,如果实在没有,就为1.

这一段话可能很难理解,逐位分析。

让我们从依次来看:

第3位:第2位和第1位比较,不相同 所以为1

第4位:第3位和第1位比较,相同,所以为2

第5位:第4位和第2位比较,不相同,和第1位比较,相同,所以为2

第6位:第5位和第2位比较, 相同,所以为3

第7位:第6位和第3位比较,不同,和第1位比较,不同,所以为1

第8位:第7位和第1位比较,相同,所以为2.

这就是next数组的手动计算方法。

接下来介绍如何根据next数组计算nextval数组

nextval是在next数组的基础上优化算法,避免不必要的浪费。其实我也不太理解nextval的具体原理,现只能介绍一下如何计算。

依旧用上面北邮的真题为例,其真题本身求的就是nextval数组

现在我们已经有了next数组:

1 2 3 4 5 6 7 8

a b a a b c a c

0 1 1 2 2 3 1 2

现在通过next数组计算nextval数组,nextval数组与next相反,是找不同,

1 2 3 4 5 6 7 8

a b a a b c a c

0 1 1 2 2 3 1 2

0 1 0 2 1 3 0 2

第1位:必为0

第2位:第2位next值为1,所以第2位和第1位比较,不同,为第2位的next 值1

第3位:第3位next值为1,所以第3位和第1位比较,相同,因为到第1位了,所以为0

第4位:第4位next值为2,所以第4位和第2位比较,不同,就为第4位next值2

第5位:第5位next值为2,所以第5位和第2位比较,相同,则继续,第2位和第1位不同,则为第2位的next值1

第6位:第6位next值为3,所以第6位和第3位比较,不同,就为第6位的next值3

第7位:第7位next值为1,所以第7位和第1位比较,相同,则为0

第8位:第8位next值为2,所以第8位和第2位比较,不同,则为第8位的next值2

【简而言之】第n位nextval数组值就是,让第n位字符和第next[n]位比较,不同,则nextval[n]=next[n],如果相同,则比较第next[next[n]]位和第next[n]位比较,如果不同,则nextVal[n]=next[next[n]].就是这样的计算方式。

 

 

    原文作者:KMP算法
    原文地址: https://blog.csdn.net/qq_37747664/article/details/82734448
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞