之前写了一篇有关正则表达式的文章,主要是介绍了正则表达式中通配符 转义字符 字符集 选择符和子模式 可选项和重复子模式 字符串的开始和结尾 ,有兴趣的可以查看博客内容。
此文章主要内容将要介绍re中的贪心和非贪心算法:
贪心:
使用 .* 匹配字符串
其中标点 . 表示通配符,可以用来匹配除换行符之外的任意符号,* 为重复子模式,允许模式重复0次或者多次;
贪心算法将会按照尽可能大的原则去匹配字符串。
非贪心:
使用 .*? 匹配字符串
其中标点 . 表示通配符,可以用来匹配除换行符之外的任意符号,* 为重复子模式,允许模式重复0次或者多次;? 为可选项。
举例说明:
使用贪心
import re
<pre style="background-color:#2b2b2b;color:#a9b7c6;font-family:'Consolas';font-size:12.8pt;"><pre name="code" class="python">s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif"
r=re.compile('xx.*xx')
content=r.findall(s)
print content
#输出结果 尽可能多地去匹配
['xxIxxefahxxlovexxhoghexxpythonxx']
使用非贪心:
import re
s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif"
r=re.compile('xx.*xx')
content=r.findall(s)
print content
#输出结果
['xxIxx', 'xxlovexx', 'xxpythonxx']
s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif"
r=re.compile('xx(.*?)xx')
content=r.findall(s)
print content
#输出结果
['I', 'love', 'python']
这里使用(.*?)的()括起来的内容为子模式 用来输出