Edit Distance
Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)
You have the following 3 operations permitted on a word:
a) Insert a character
b) Delete a character
c) Replace a character
动态规划
复杂度
时间 O(NM) 空间 O(NM)
思路
这是算法导论中经典的一道动态规划的题。假设dp[i-1][j-1]
表示一个长为i-1的字符串str1变为长为j-1的字符串str2的最短距离,如果我们此时想要把str1a这个字符串变成str2b这个字符串,我们有如下几种选择:
替换: 在
str1
变成str2
的步骤后,我们将str1a
中的a
替换为b
,就得到str2b
(如果a
和b
相等,就不用操作)增加: 在
str1a
变成str2
的步骤后,我们再在末尾添加一个b
,就得到str2b
(str1a
先根据已知距离变成str2
,再加个b
)删除: 在
str1
变成str2b
的步骤后,对于str1a
,我们将末尾的a
删去,就得到str2b
(str1a
将a
删去得到str1
,而str1
到str2b
的编辑距离已知)
根据这三种操作,我们可以得到递推式
若a和b相等:
dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i][j])
若a和b不相等:
dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i][j]+1)
因为将一个非空字符串变成空字符串的最小操作数是字母个数(全删),反之亦然,所以:
dp[0][j]=j, dp[i][0]=i
最后我们只要返回dp[m][n]
即可,其中m是word1的长度,n是word2的长度
代码
public class Solution {
public int minDistance(String word1, String word2) {
int m = word1.length(), n = word2.length();
int[][] dp = new int[m + 1][n + 1];
// 初始化空字符串的情况
for(int i = 1; i <= m; i++){
dp[i][0] = i;
}
for(int i = 1; i <= n; i++){
dp[0][i] = i;
}
for(int i = 1; i <= m; i++){
for(int j = 1; j <= n; j++){
// 增加操作:str1a变成str2后再加上b,得到str2b
int insertion = dp[i][j-1] + 1;
// 删除操作:str1a删除a后,再由str1变为str2b
int deletion = dp[i-1][j] + 1;
// 替换操作:先由str1变为str2,然后str1a的a替换为b,得到str2b
int replace = dp[i-1][j-1] + (word1.charAt(i - 1) == word2.charAt(j - 1) ? 0 : 1);
// 三者取最小
dp[i][j] = Math.min(replace, Math.min(insertion, deletion));
}
}
return dp[m][n];
}
}