0072. 编辑距离
大约 3 分钟
0072. 编辑距离
- 标签:字符串、动态规划
- 难度:困难
题目链接
题目大意
描述:给定两个单词 、。
对一个单词可以进行以下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
要求:计算出将 转换为 所使用的最少操作数。
说明:
- 。
- 和 由小写英文字母组成。
示例:
- 示例 1:
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
- 示例 2:
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
解题思路
思路 1:动态规划
1. 划分阶段
按照两个字符串的结尾位置进行阶段划分。
2. 定义状态
定义状态 表示为:「以 中前 个字符组成的子字符串 」变为「以 中前 个字符组成的子字符串 」,所需要的最少操作次数。
3. 状态转移方程
- 如果当前字符相同(),无需插入、删除、替换。。
- 如果当前字符不同(), 取源于以下三种情况中的最小情况:
- 替换( 替换为 ):最少操作次数依赖于「以 中前 个字符组成的子字符串 」变为「以 中前 个字符组成的子字符串 」,再加上替换的操作数 ,即:。
- 插入( 在第 位置上插入元素):最少操作次数依赖于「以 中前 个字符组成的子字符串 」 变为「以 中前 个字符组成的子字符串 」,再加上插入需要的操作数 ,即:。
- 删除( 删除第 位置元素):最少操作次数依赖于「以 中前 个字符组成的子字符串 」变为「以 中前 个字符组成的子字符串 」,再加上删除需要的操作数 ,即:。
综合上述情况,状态转移方程为:
4. 初始条件
- 当 ,「以 中前 个字符组成的子字符串 」为空字符串,「」变为「以 中前 个字符组成的子字符串 」时,至少需要插入 次,即:。
- 当 ,「以 中前 个字符组成的子字符串 」为空字符串,「以 中前 个字符组成的子字符串 」变为「」时,至少需要删除 次,即:。
5. 最终结果
根据状态定义,最后输出 (即 变为 所使用的最少操作数)即可。其中 、 分别为 、 的字符串长度。
思路 1:代码
class Solution:
def minDistance(self, word1: str, word2: str) -> int:
size1 = len(word1)
size2 = len(word2)
dp = [[0 for _ in range(size2 + 1)] for _ in range(size1 + 1)]
for i in range(size1 + 1):
dp[i][0] = i
for j in range(size2 + 1):
dp[0][j] = j
for i in range(1, size1 + 1):
for j in range(1, size2 + 1):
if word1[i - 1] == word2[j - 1]:
dp[i][j] = dp[i - 1][j - 1]
else:
dp[i][j] = min(dp[i - 1][j - 1], dp[i - 1][j], dp[i][j - 1]) + 1
return dp[size1][size2]
思路 1:复杂度分析
- 时间复杂度:,其中 、 分别是字符串 、 的长度。两重循环遍历的时间复杂度是 ,所以总的时间复杂度为 。
- 空间复杂度:。用到了二维数组保存状态,所以总体空间复杂度为 。