之前的Rabin-Karp算法虽然在一定程度上达到了优化,但是最坏情况下也是O(nm)的复杂度。
接下来说说KMP算法,复杂度是线性的O(n+m)
前缀表
• 我们可以预先计算大小为m的前缀表来存储p[q]的
值 (0 <=q < m)
P p a p p a r
q 0 1 2 3 4 5 6
p[q] 0 0 0 1 1 2 0
Knuth-Morris-Pratt 算法
KMP-Search(T,P)
01 pi <- Compute-Prefix-Table(P) //预处理前缀表P
02 q <- 0 // number of characters matched
03 for i <- 0 to n-1 // scan the text from left to right
04 while q > 0 and P[q] <> T[i] do
05 q <- p[q]
06 if P[q] = T[i] then q <- q + 1
07 if q = m then return i – m + 1
08 return –1
Compute-Prefix-Table 是P 上执行KMP 算法的本质.
KMP 的分析
• 最坏运行时间: O(n+m)
– 主算法: O(n)
– Compute-Prefix-Table: O(m)
• 空间: O(m)