[Leetcode]10. 正则表达式匹配

2023年9月1日 273次阅读来源: LeeYunFeng

题目描述：
给定一个字符串 (s) 和一个字符模式 (p)。实现支持 ‘.’ 和 ‘‘ 的正则表达式匹配。
‘.’ 匹配任意单个字符。
‘‘ 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串 (s) ，而不是部分字符串。
说明:
s 可能为空，且只包含从 a-z 的小写字母。
p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *。

示例 1:
输入:
s = “aa”
p = “a”
输出: false
解释: “a” 无法匹配 “aa” 整个字符串。
示例 2:
输入:
s = “aa”
p = “a“
输出: true
解释: ‘‘ 代表可匹配零个或多个前面的元素, 即可以匹配 ‘a’ 。因此, 重复 ‘a’ 一次, 字符串可变为 “aa”。
示例 3:
输入:
s = “ab”
p = “.“
输出: true
解释: “.” 表示可匹配零个或多个(‘*’)任意字符(‘.’)。
示例 4:
输入:
s = “aab”
p = “cab”
输出: true
解释: ‘c’ 可以不被重复, ‘a’ 可以被重复一次。因此可以匹配字符串 “aab”。
示例 5:
输入:
s = “mississippi”
p = “misisp*.”
输出: false

笨办法1：
直接逐个字母的比对肯定是不行的。我能够想到的一个也许可行的思路是：使用list+dict来记录整个字符串。具体来说，就是记录下字符串中每个字符连续出现的次数。比如：aab记录为[{‘a’:2},{‘b’:1}]，mississippi记录为[{‘m’:1},{‘i’:1},……]，以此类推。而对于包含*或者.的字符串，则进行转义。
进行转义的时候，需要考虑以下几种情况：

字母后接时，例如a，记录为{a:star}
字母后接.时，例如a.，记录为{a:1, dot:1}
.后接时，例如.，记录为{dot:star}，表示0个或多个任意字符
后接.时，例如a.，记录为{a:1+star,dot:1}
开头时，例如abc，记录为{a:1,b:1,c:1}，此时*不起作用
.开头时，例如.abc，记录为{dot:1,a:1,b:1,c:1}，.相当于一个字符
说到底，*代表的是数量，作为dict的value存在。.代表的是字符，作为dict的key存在。
即便做了转换，也还是无法通过逐个字符比对来判定是否匹配。说到底，这能算是一个初级的思路，最终证明难以用来解决问题。

笨办法2：
最后，直接使用re库的match方法。没想到很多人也是用的re库来解决，并不算取巧哇。因为re.match方法还是有些参数比较特别，人们也不一定清楚怎么用。re.match(‘a.*’,’ab’).group(0)==’ab’，这就表示匹配成功。
耗时84ms，战胜了72%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        import re
        m=re.match(p,s)
        if m and m.span()[1]==len(s):
            return True
        else:
            return False

聪明的方法：
没想到是使用递归+动态规划的思路解决，当然也可以用纯递归的思路解决。我有考虑过动态规划，但没有考虑过用递归+动态规划的方法。
其实这题的思路，关键还是递归，为什么呢？单纯匹配.很容易，关键是*的匹配。如果逐个字符的匹配，处理逻辑很复杂。但用递归来处理就简单多了，问题就简化为以下两种情况：

如果s[0]==p[0] and p[1]==’*’，只要s[1:]==p[2:]，两个字符串就相等。
如果s[0]==p[0] and p[1]!=’*’，只要s[1:]==p[1:]，两个字符串就相等。
递归可以处理s中包含任意多个连续的相同字符的情况。用其余的思路都很难处理。

用时1848ms，击败6.7%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        # 如果not p非空，也就是p为空，则返回not s
        if not p:
            return not s
        # 下面处理p非空的情况
        # 检测首字符是否相等
        first_match=bool(s) and p[0] in (s[0],'.')
        # 递归处理后续字符
        # 首字符相等 且 后续字符匹配
        # 考虑只有两个字符和两个以上字符的情况
        if len(p)>=2 and p[1]=='*':
            #同时考虑首字母不匹配和首字母匹配的情况
            return self.isMatch(s,p[2:]) or (first_match and self.isMatch(s[1:],p))
        else:
            return first_match and self.isMatch(s[1:],p[1:])

用动态规划+递归的思想，可以更快的解决这个问题。这个解法的核心与递归解法类似，但时间复杂度是O（S*P）。该解法中，关键要搞清楚结束条件是：i和j同时移动到末尾。如果没有同时移动到末尾，比如j移动到了末尾，而i只到中间位置，那么s和p便不匹配。
用时44ms，击败了98.5%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        memo={} #存储动态规划的结果
        #dp(i,j)表示s[i:]和p[j:]是否匹配
        def dp(i,j):
            if (i,j) not in memo:
                #结束条件：i和j同时移动到末尾
                if j==len(p):
                    ans=i==len(s)
                else:
                    # 类似于递归解法，关键是搞清楚dp(i,j)表示s[i:]和p[j:]是否匹配
                    first_match=i<len(s) and p[j] in (s[i],'.')
                    if j+1<len(p) and p[j+1]=='*':
                        ans=dp(i,j+2) or first_match and dp(i+1,j)
                    else:
                        ans=first_match and dp(i+1,j+1)
                memo[i,j]=ans
            return memo[i,j]
        
        return dp(0,0)

    原文作者：LeeYunFeng
    原文地址: https://www.jianshu.com/p/ea60aa3701aa
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。