[Leetcode] Edit Distance 最小编辑距离

Edit Distance

Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)

You have the following 3 operations permitted on a word:

a) Insert a character
b) Delete a character
c) Replace a character

动态规划

复杂度

时间 O(NM) 空间 O(NM)

思路

这是算法导论中经典的一道动态规划的题。假设dp[i-1][j-1]表示一个长为i-1的字符串str1变为长为j-1的字符串str2的最短距离,如果我们此时想要把str1a这个字符串变成str2b这个字符串,我们有如下几种选择:

  1. 替换: 在str1变成str2的步骤后,我们将str1a中的a替换为b,就得到str2b (如果ab相等,就不用操作)

  2. 增加: 在str1a变成str2的步骤后,我们再在末尾添加一个b,就得到str2b (str1a先根据已知距离变成str2,再加个b)

  3. 删除: 在str1变成str2b的步骤后,对于str1a,我们将末尾的a删去,就得到str2b (str1aa删去得到str1,而str1str2b的编辑距离已知)

根据这三种操作,我们可以得到递推式
若a和b相等:

dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i][j])

若a和b不相等:

dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i][j]+1)

因为将一个非空字符串变成空字符串的最小操作数是字母个数(全删),反之亦然,所以:

dp[0][j]=j, dp[i][0]=i

最后我们只要返回dp[m][n]即可,其中m是word1的长度,n是word2的长度

详解请看斯坦福课件

代码

public class Solution {
    public int minDistance(String word1, String word2) {
        int m = word1.length(), n = word2.length();
        int[][] dp = new int[m + 1][n + 1];
        // 初始化空字符串的情况
        for(int i = 1; i <= m; i++){
            dp[i][0] = i;
        }
        for(int i = 1; i <= n; i++){
            dp[0][i] = i;
        }
        for(int i = 1; i <= m; i++){
            for(int j = 1; j <= n; j++){
                // 增加操作:str1a变成str2后再加上b,得到str2b
                int insertion = dp[i][j-1] + 1;
                // 删除操作:str1a删除a后,再由str1变为str2b
                int deletion = dp[i-1][j] + 1;
                // 替换操作:先由str1变为str2,然后str1a的a替换为b,得到str2b
                int replace = dp[i-1][j-1] + (word1.charAt(i - 1) == word2.charAt(j - 1) ? 0 : 1);
                // 三者取最小
                dp[i][j] = Math.min(replace, Math.min(insertion, deletion));
            }
        }
        return dp[m][n];
    }
}
    原文作者:ethannnli
    原文地址: https://segmentfault.com/a/1190000003741294
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞