KMP算法(字符串匹配算法)之PHP语言实现

KMP算法(模式匹配算法):该算法的关键是求出P0···Pi的最大相同前后缀长度k(部分匹配表):

首先,要了解两个概念:”前缀”和”后缀”。 “前缀”指除了最后一个字符以外,一个字符串的全部头部组合;”后缀”指除了第一个字符以外,一个字符串的全部尾部组合。

《KMP算法(字符串匹配算法)之PHP语言实现》

“部分匹配值”就是”前缀”和”后缀”的最长的共有元素的长度。以”ABCDABD”为例,

-”A”的前缀和后缀都为空集,共有元素的长度为0;

-”AB”的前缀为[A],后缀为[B],共有元素的长度为0;

-”ABC”的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;

-”ABCD”的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;

-”ABCDA”的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为”A”,长度为1;

-”ABCDAB”的前缀为[A, AB, ABC, ABCD,ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为”AB”,长度为2;

-”ABCDABD”的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD,CDABD, DABD, ABD, BD, D],共有元素的长度为0。

《KMP算法(字符串匹配算法)之PHP语言实现》

“部分匹配”的实质是,有时候,字符串头部和尾部会有重复。比如,”ABCDAB”之中有两个”AB”,那么它的”部分匹配值”就是2(”AB”的长度)。搜索词移动的时候,第一个”AB”向后移动4位(字符串长度6 –部分匹配值2 = 4),就可以来到第二个”AB”的位置。

下面给出计算部分匹配表和字符串匹配算法的php程序: 

php程序如下:
<?php
$next = array(0);
$Tstring = "ababxbababcadfdsssabcdabdrwgewwrabcdabd";
$Pstring = "abcdabd";

printf("String is: %s\n", $Tstring);
echo "<br>";
printf("You find string is: %s\n", $Pstring);
echo "<br>";

kmp($Tstring, $Pstring, $next); // 计算部分匹配表和字符串匹配算法

function kmp($Tstring, $Pstring, &$next)
{
    $n = strlen($Tstring); // 字符串
    $m = strlen($Pstring);
    makeNext($Pstring,$next); // 计算模式匹配表

    for ($i = 0, $q = 0; $i < $n; ++$i)
    {
        while($q > 0 && $Pstring[$q] != $Tstring[$i])
            $q = $next[$q-1];
        if ($Pstring[$q] == $Tstring[$i])
        {
            $q++;
        }
        if ($q == $m)
        {
            printf("Pattern occurs with shift:%d ",($i - $m + 1));
            printf(" You find string is:%s\n", $Pstring);
            echo "<br>";
        }
    }
}
function makeNext($Pstring, &$next)
{
    $m = strlen($Pstring); // 此时为数组
    $next[0] = 0;
    for ($q = 1, $k = 0; $q < $m; ++$q)
    {
        while($k > 0 && $Pstring[$q] != $Pstring[$k])
            $k = $next[$k-1];
        if ($Pstring[$q] == $Pstring[$k])
        {
            $k++;
        }
        $next[$q] = $k;
    }
    printf("The next table is:\n");
    for ($i = 0; $i < strlen($Pstring); ++$i) {
        printf("%d ", $next[$i]);
    }
    echo "<br>";
}
?>:

输出结果:

String is: ababxbababcadfdsssabcdabdrwgewwrabcdabd 

You find string is: abcdabd 

The next table is: 0 0 0 0 1 2 0 

Pattern occurs with shift:18 You find string is:abcdabd 

Pattern occurs with shift:32 You find string is:abcdabd 

部分内容参考:http://www.cnblogs.com/c-cloud/p/3224788.html  和 http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

    原文作者:KMP算法
    原文地址: https://blog.csdn.net/dalaoadalaoa/article/details/50611465
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞