KMP算法总结

KMP算法是用来实现模式匹配的,其时间复杂度是O(m+n),具体原理见:http://kb.cnblogs.com/page/176818/

其中有用到next[]数组来计算子串中公共项的位数,简单来说,就是子串遇到不匹配时,就查next数据来决定前进几位(移动位数 = 已匹配的字符数 – 对应的部分匹配值-1)(要不要减一看next数组第一位是不是为1,个人觉得加一后是有好处的,好处见我的理解的第一条,不好的地方在于不能直接表示首尾匹配的个数,要减一才可以)。

可以这么任性的前进几位的依据在于:已经匹配的部分相当于已知的且固定的,因此我们可以用next数组一次性来计算完成

next[i]值得计算具体如下:

以下这段是复制牛客网上以为大牛的解释,很到位:

链接:https://www.nowcoder.com/questionTerminal/57bdf294407c4477969fc7b4d56c7be7
来源:牛客网

这是借鉴网上的,个人觉得比较清晰:
首先看看next数组值的求解方法例如: 
模式串 a b a a b c a c 

next值 0 1 1 2 2 3 1 2 

       

       next数组的求解方法是:第一位的next值为0,第二位的next值为1,后面求解每一位的next值时,根据前一位进行比较。首先将前一位与其next值对应的内容进行比较,如果相等,则该位的next值就是前一位的next值加上1;如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值即为1。

       看起来很令人费解,利用上面的例子具体运算一遍。

       1.前两位必定为0和1。

       2.计算第三位的时候,看第二位b的next值,为1,则把b和1对应的a进行比较,不同,则第三位a的next的值为1,因为一直比到最前一位,都没有发生比较相同的现象。

       3.计算第四位的时候,看第三位a的next值,为1,则把a和1对应的a进行比较,相同,则第四位a的next的值为第三位a的next值加上1。为2。因为是在第三位实现了其next值对应的值与第三位的值相同。

       4.计算第五位的时候,看第四位a的next值,为2,则把a和2对应的b进行比较,不同,则再将b对应的next值1对应的a与第四位的a进行比较,相同,则第五位的next值为第二位b的next值加上1,为2。因为是在第二位实现了其next值对应的值与第四位的值相同。

       5.计算第六位的时候,看第五位b的next值,为2,则把b和2对应的b进行比较,相同,则第六位c的next值为第五位b的next值加上1,为3,因为是在第五位实现了其next值对应的值与第五位相同。

       6.计算第七位的时候,看第六位c的next值,为3,则把c和3对应的a进行比较,不同,则再把第3位a的next值1对应的a与第六位c比较,仍然不同,则第七位的next值为1。

       7.计算第八位的时候,看第七位a的next值,为1,则把a和1对应的a进行比较,相同,则第八位c的next值为第七位a的next值加上1,为2,因为是在第七位和实现了其next值对应的值与第七位相同。


我的理解:

next[i]的的意义在于:第i个值时会首先与next[i-1]中的值比较,如果相同next[i]的值就在next[i-1]的基础上加一,如果不同就去比较第一个值,相同就为2,不同为1.

点赞