Hard
fb tag
https://www.youtube.com/watch?v=DqhPJ8MzDKM
此题简称为”p中找s”, 用dp做。
这道题一开始我naive地觉得如果p.length() < s.length()则一定return false. 然而*
的含义是零个或多个它前面的字符,所以完全可能p的长度没有s长,因为*
可以控制字符数. 这里我们assume *
只可能出现在charAt(i) i >= 1.
dp[i][j]表示s.substring(0, i)跟p.substring(0, j)是不是匹配,也就是s里面前i个字符跟p里面前j个字符是否匹配。
首先dp[0][0] = true,因为两个空字符是相匹配的。
至于我们为什么要单独把dp[0][i]单独拿出来初始化,是因为后面当i >= 1, j >= 1的时候,我们要用到dp[i-1][j-1]这样的前面的状态,而dp[0][something]带入到这里的话就会越界。同样很intuitive的我们可以知道dp[something][0] = false, 因为在空字符里面你怎么找也找不到s. 所以就不单独initialize了。
那么中间的部分,我们分两种大类讨论。
- 斜线(对角线)递推
- 直线(左到右,上到下)递推
斜线递推是说当p.charAt(j-1) == s.charAt(i-1)
时,或者p.charAt(j-1) == '.'
时,我们的dp[i][j] = dp[i-1][j-1]
, 就相当于一条斜线从左上角i-1,j-1穿到了i,j.
直线递推是当p.charAt(j-1) == *
时,我们可以选择让它代表前面的字符一共0个或者多个。当它代表前面的字符零个的时候,我们就相当于把p删掉了后面两个字符,所以dp[i][j] = dp[i][j-2]
. 当它代表前面的字符有多个的时候,我们要考虑一种特殊情况,就是当p.charAt(j-2) == s.charAt(i-1)
, 也就是p倒数第二个字符(倒数第一个是*
)等于s的倒数第一个字符,或者p的倒数第二个字符干脆就是任意字符.
,这种情况dp[i][j] = dp[i-1][j]
, 也就是如果这时候s除去最后一个字符剩下的部分跟p匹配的话,因为*
可以让p继续添加一个当前最后的字符,而这个字符又刚好等于s的最后一个字符,所以他们会继续匹配,因此此时dp[i][j] = dp[i-1][j]
. 比如p = ab*, s = abb, 这时候就可以得到dp[3][3] = dp[2][3]. 但是这种情况我们不能直接就不考虑 *
代表零个了,而是只要其中一种匹配就return true.
这个test case可以测出来必须两个都写:
“aaa”
“ab*
a*
c*
a”
class Solution {
public boolean isMatch(String s, String p) {
if (p == null || s == null){
return false;
}
//"aaa"
//".*"
boolean[][] dp = new boolean[s.length() + 1][p.length() + 1];
//dp[i][j]: s.substring(0, i) matches with p.substring(0, j); i,j means number of characters,not index.
dp[0][0] = true; //"" matches ""
for(int i = 1; i < p.length() + 1; i++){
if (p.charAt(i-1) == '*'){
dp[0][i] = dp[0][i-2];
}
}
for (int i = 1; i < s.length() + 1; i++){
for (int j = 1; j < p.length() + 1; j++){
if (s.charAt(i-1) == p.charAt(j-1) || p.charAt(j-1) == '.'){
dp[i][j] = dp[i-1][j-1];
} else if (p.charAt(j-1) == '*'){
//"*" could means zero or multiple
if (p.charAt(j-2) == s.charAt(i-1) || p.charAt(j-2) == '.'){
dp[i][j] = dp[i-1][j] || dp[i][j-2];
} else {
dp[i][j] = dp[i][j-2];
}
}
}
}
return dp[s.length()][p.length()];
}
}