之前有一篇文章总结了一些字符串类的算法题目。
http://www.cnblogs.com/charlesblc/p/5987936.html
这里接着看。
下面这篇文章介绍了两道题目:最长重复子串,和最长不重复子串。分别用到了精妙的方法。
http://blog.csdn.net/hackbuteer1/article/details/7968623
给定一个字符串,求出其最长重复子串
例如:abcdabcd
最长重复子串是 abcd,最长重复子串可以重叠。
直观的解法是,首先检测长度为 n – 1 的字符串情况,如果不存在重复则检测 n – 2, 一直递减下去,直到 1 。
这种方法的时间复杂度是 O(N * N * N),其中包括三部分,长度纬度、根据长度检测的字符串数目、字符串检测。
改进的方法是利用后缀数组
后缀数组是一种数据结构,对一个字符串生成相应的后缀数组后,然后再排序,排完序依次检测相邻的两个字符串的开头公共部分。
这样的时间复杂度为:生成后缀数组 O(N),排序 O(NlogN*N) 最后面的 N 是因为字符串比较也是 O(N)
依次检测相邻的两个字符串 O(N * N),总的时间复杂度是 O(N^2*logN),优于第一种方法的 O(N^3)
方法二:KMP
通过使用next数组的特性,同样可以求最长重复子串,不过时间复杂度有点高挖。。
题目描述:求最长不重复子串(指的是没有重复字符串出现),如abcdefgegcsgcasse,最长不重复子串为abcdefg,长度为7