6. 标题:最大公共子串
最大公共子串长度问题就是:
求两个串的所有子串中能够匹配上的最大长度是多少。
比如:”abcdkkk” 和 “baabcdadabc”,
可以找到的最长的公共子串是”abcd”,所以最大公共子串长度为4。
下面的程序是采用矩阵法进行求解的,这对串的规模不大的情况还是比较有效的解法。
请分析该解法的思路,并补全划线部分缺失的代码。
#include <stdio.h>
#include <string.h>
#define N 256
int f(const char* s1, const char* s2)
{
int a[N][N];
int len1 = strlen(s1);
int len2 = strlen(s2);
int i,j;
memset(a,0,sizeof(int)*N*N);
int max = 0;
for(i=1; i<=len1; i++){
for(j=1; j<=len2; j++){
if(s1[i-1]==s2[j-1]) {
a[i][j] = __________________________; //
填空
if(a[i][j] > max) max = a[i][j];
}
}
}
return max;
}
int main()
{
printf(“%d\n”, f(“abcdkkk”, “baabcdadabc”));
return 0;
}
注意:只提交缺少的代码,不要提交已有的代码和符号。也不要提交说明性文字。
分析:
动态规划-空间换时间
暴力解法是以子串开端开始寻找
动态规划法是利用相同子串的字符结尾。
设两个字符串分别为s1、s2,s1[i]和s2[j]分别表示其第i和j个字符
再设a[i,j]表示以s1[i]和s2[j]结尾的子串的最大长度。
那么s1,s2分别再向下走一个字符,我们可以推断出a[i+1,j+1]与a[i,j]之间的关系,
如果s1[i] ==s2[j],那么a[i+1,j+1] = a[i,j] + 1;否则a[i+1,j+1] =0。
a[i+1,j+1] = (s1[i] == B[j] ? a[i,j] + 1 : 0)
而如果s1[i+1]和s2[j+1]相同,那么就只要在以s1[i]和s2[j]结尾的最长相同子串之后分别添上这两个字符即可,这样就可以让长度增加一位
综上所述,就是a[i+1,j+1] = (s1[i+1] == s2[j+1] ? a[i,j] + 1 : 0)的关系
由上述关系,想到了使用二维数组来存储两个字符串之间的相同子串关系
因为a[i+1,j+1] = (s1[i+1] ==s2[j+1] ? a[i,j] + 1 : 0)关系,只计算二维数据的最上列和最左列数值即可,其他数值通过K[i+1,j+1] = (A[i+1] == B[j+1] ? K[i,j] + 1 : 0)可得。如下图所示:
#include <stdio.h>
#include <string.h>
#define N 256
int f(const char* s1, const char* s2)
{
int a[N][N];
int len1 = strlen(s1);
int len2 = strlen(s2);
int i,j;
memset(a,0,sizeof(int)*N*N);
int max = 0;
for(i=1; i<=len1; i++){
for(j=1; j<=len2; j++){
if(s1[i-1]==s2[j-1]) {
a[i][j] =a[i-1][j-1]+1; //填空
if(a[i][j] > max) max = a[i][j];
}
}
}
return max;
}
int main()
{
printf("%d\n", f("abcdkkk", "baabcdadabc"));
return 0;
}