[Leetcode]10. 正则表达式匹配

题目描述:
给定一个字符串 (s) 和一个字符模式 (p)。实现支持 ‘.’ 和 ‘‘ 的正则表达式匹配。
‘.’ 匹配任意单个字符。
‘ 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串 (s) ,而不是部分字符串。
说明:
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。

  • 示例 1:
    输入:
    s = “aa”
    p = “a”
    输出: false
    解释: “a” 无法匹配 “aa” 整个字符串。

  • 示例 2:
    输入:
    s = “aa”
    p = “a
    输出: true
    解释: ‘
    ‘ 代表可匹配零个或多个前面的元素, 即可以匹配 ‘a’ 。因此, 重复 ‘a’ 一次, 字符串可变为 “aa”。

  • 示例 3:
    输入:
    s = “ab”
    p = “.
    输出: true
    解释: “.
    ” 表示可匹配零个或多个(‘*’)任意字符(‘.’)。

  • 示例 4:
    输入:
    s = “aab”
    p = “cab”
    输出: true
    解释: ‘c’ 可以不被重复, ‘a’ 可以被重复一次。因此可以匹配字符串 “aab”。

  • 示例 5:
    输入:
    s = “mississippi”
    p = “misisp*.”
    输出: false

笨办法1:
直接逐个字母的比对肯定是不行的。我能够想到的一个也许可行的思路是:使用list+dict来记录整个字符串。具体来说,就是记录下字符串中每个字符连续出现的次数。比如:aab记录为[{‘a’:2},{‘b’:1}],mississippi记录为[{‘m’:1},{‘i’:1},……],以此类推。而对于包含*或者.的字符串,则进行转义。
进行转义的时候,需要考虑以下几种情况:

  • 字母后接时,例如a,记录为{a:star}
  • 字母后接.时,例如a.,记录为{a:1, dot:1}
  • .后接时,例如.,记录为{dot:star},表示0个或多个任意字符
  • 后接.时,例如a.,记录为{a:1+star,dot:1}
  • 开头时,例如abc,记录为{a:1,b:1,c:1},此时*不起作用
  • .开头时,例如.abc,记录为{dot:1,a:1,b:1,c:1},.相当于一个字符
    说到底,*代表的是数量,作为dict的value存在。.代表的是字符,作为dict的key存在。
    即便做了转换,也还是无法通过逐个字符比对来判定是否匹配。说到底,这能算是一个初级的思路,最终证明难以用来解决问题。

笨办法2:
最后,直接使用re库的match方法。没想到很多人也是用的re库来解决,并不算取巧哇。因为re.match方法还是有些参数比较特别,人们也不一定清楚怎么用。re.match(‘a.*’,’ab’).group(0)==’ab’,这就表示匹配成功。
耗时84ms,战胜了72%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        import re
        m=re.match(p,s)
        if m and m.span()[1]==len(s):
            return True
        else:
            return False

聪明的方法:
没想到是使用递归+动态规划的思路解决,当然也可以用纯递归的思路解决。我有考虑过动态规划,但没有考虑过用递归+动态规划的方法。
其实这题的思路,关键还是递归,为什么呢?单纯匹配.很容易,关键是*的匹配。如果逐个字符的匹配,处理逻辑很复杂。但用递归来处理就简单多了,问题就简化为以下两种情况:

  1. 如果s[0]==p[0] and p[1]==’*’,只要s[1:]==p[2:],两个字符串就相等。
  2. 如果s[0]==p[0] and p[1]!=’*’,只要s[1:]==p[1:],两个字符串就相等。
    递归可以处理s中包含任意多个连续的相同字符的情况。用其余的思路都很难处理。

用时1848ms,击败6.7%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        # 如果not p非空,也就是p为空,则返回not s
        if not p:
            return not s
        # 下面处理p非空的情况
        # 检测首字符是否相等
        first_match=bool(s) and p[0] in (s[0],'.')
        # 递归处理后续字符
        # 首字符相等 且 后续字符匹配
        # 考虑只有两个字符和两个以上字符的情况
        if len(p)>=2 and p[1]=='*':
            #同时考虑首字母不匹配和首字母匹配的情况
            return self.isMatch(s,p[2:]) or (first_match and self.isMatch(s[1:],p))
        else:
            return first_match and self.isMatch(s[1:],p[1:])

用动态规划+递归的思想,可以更快的解决这个问题。这个解法的核心与递归解法类似,但时间复杂度是O(S*P)。该解法中,关键要搞清楚结束条件是:i和j同时移动到末尾。如果没有同时移动到末尾,比如j移动到了末尾,而i只到中间位置,那么s和p便不匹配。
用时44ms,击败了98.5%的用户。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        memo={} #存储动态规划的结果
        #dp(i,j)表示s[i:]和p[j:]是否匹配
        def dp(i,j):
            if (i,j) not in memo:
                #结束条件:i和j同时移动到末尾
                if j==len(p):
                    ans=i==len(s)
                else:
                    # 类似于递归解法,关键是搞清楚dp(i,j)表示s[i:]和p[j:]是否匹配
                    first_match=i<len(s) and p[j] in (s[i],'.')
                    if j+1<len(p) and p[j+1]=='*':
                        ans=dp(i,j+2) or first_match and dp(i+1,j)
                    else:
                        ans=first_match and dp(i+1,j+1)
                memo[i,j]=ans
            return memo[i,j]
        
        return dp(0,0)
    原文作者:LeeYunFeng
    原文地址: https://www.jianshu.com/p/ea60aa3701aa
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞