8、字符串编辑距离
...About 2 min
8、字符串编辑距离
392. 判断子序列——入门题(公共子序列问题)
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)
进阶:
如果有大量输入的 S,称作 S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
示例 1:
输入:s = "abc", t = "ahbgdc"
输出:true
示例 2:
输入:s = "axc", t = "ahbgdc"
输出:false
提示:
0 <= s.length <= 1000 <= t.length <= 10^4- 两个字符串都只由小写字符组成。
思路:
当s[i]==t[j],dp[i+1][j+1] = dp[i][j]+1
当s[i]!=t[j],dp[i+1][j+1] = max(dp[i+1][j], dp[i][j])
递归五部曲
- dp数组含义:表示以下标i为结尾的字符串s,和以下标j为结尾的字符串t,相同子序列的长度为
dp[i][j]。 - 递归公式
- s[i]==t[j],
dp[i+1][j+1] = dp[i][j]+1 - s[i]!=t[j],
dp[i+1][j+1] = max(dp[i+1][j], dp[i][j])
- s[i]==t[j],
- 初始化0即可
- 遍历顺序,从上到下从左到右,正序
class Solution:
def isSubsequence(self, s: str, t: str) -> bool:
m = len(s)
n = len(t)
dp = [[0] * (n + 1) for _ in range(m + 1)]
for i in range(m):
for j in range(n):
if s[i] == t[j]:
dp[i + 1][j + 1] = dp[i][j] + 1
else:
dp[i + 1][j + 1] = max(dp[i + 1][j], dp[i][j])
# print(dp)
return dp[-1][-1] == m
115. 不同的子序列——出现个数
给你两个字符串 s 和 t ,统计并返回在 s 的 子序列 中 t 出现的个数,结果需要对 109 + 7 取模。
示例 1:
输入:s = "rabbbit", t = "rabbit"
输出:3
解释:
如下所示, 有 3 种可以从 s 中得到 "rabbit" 的方案。
rabbbit
rabbbit
rabbbit
示例 2:
输入:s = "babgbag", t = "bag"
输出:5
解释:
如下所示, 有 5 种可以从 s 中得到 "bag" 的方案。
babgbag
babgbag
babgbag
babgbag
babgbag
class Solution:
def numDistinct(self, s: str, t: str) -> int:
m = len(s)
n = len(t)
dp = [[0] * (n + 1) for _ in range(m + 1)]
for i in range(len(s)):
dp[i][0] = 1
for j in range(1, len(t)):
dp[0][j] = 0
for i in range(m):
for j in range(n):
if s[i] == t[j]:
dp[i + 1][j + 1] = dp[i][j] + dp[i][j+1]
else:
dp[i + 1][j + 1] = dp[i][j + 1]
# print(dp)
return dp[-1][-1]
Powered by Waline v2.15.8