leetcode72-编辑距离

原题

给你两个单词 word1word2 ,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

  1. 插入一个字符
  2. 删除一个字符
  3. 替换一个字符

 
示例1:

输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例2:

输入: word1 = "intention", word2 = "execution"
输出: 5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

解法

思想

编辑距离算法,和KMP算法一样,属于字符串处理里面的经典算法了,KMP算法属于精准模式匹配,而编辑距离算法用于处理两个字符串之间的相似度,也属于一种匹配方式。

一般来说,编辑距离越小,两个字符串的相似度越大。 并且编辑距离算法广泛运用于生产中,例如搜索引擎通过编辑距离算法来智能识错,word软件通过编辑距离算法做拼写检查。

思想就是动态规划:

leetcode72-编辑距离

画一个矩阵,中间的格子代表从一个字符串到另一个字符串的编辑距离。

对于第一行、第一列,我们提前赋值1~n,代表仅通过插入的方式计算的编辑距离。

然后,对于任意一个格子,例如图中的红色格子dp[m][n],它可能由字符串A插入一个字符、字符串B插入一个字符,字符串A修改一个字符得到,对于修改字符,如果两个字符串在该位置上的字符相同,则不用修改,对应的最小编辑距离就是min(dp[m][n-1],dp[m-1][n],dp[m-1][n-1]-1)+1,实际上最小的必是dp[m-1][n-1]-1,即此时编辑距离为dp[m-1][n-1],如果两个字符串在该位置上的字符不同,则需要修改最后一个字符,此时最小编辑距离为min(dp[m][n-1],dp[m-1][n],dp[m-1][n-1])+1

代码

class Solution {
    public int minDistance(String word1, String word2) {
        int n1 = word1.length();
        int n2 = word2.length();
        int[][] dp = new int[n1 + 1][n2 + 1];
        // 第一行
        for (int j = 1; j <= n2; j++) dp[0][j] = dp[0][j - 1] + 1;
        // 第一列
        for (int i = 1; i <= n1; i++) dp[i][0] = dp[i - 1][0] + 1;

        for (int i = 1; i <= n1; i++) {
            for (int j = 1; j <= n2; j++) {
                if (word1.charAt(i - 1) == word2.charAt(j - 1)) dp[i][j] = dp[i - 1][j - 1];
                else dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
            }
        }
        return dp[n1][n2];  
    }
}

原创文章,作者:彭晨涛,如若转载,请注明出处:https://www.codetool.top/article/leetcode72-%e7%bc%96%e8%be%91%e8%b7%9d%e7%a6%bb/