关卡地址:http://www.pythonchallenge.com/pc/def/equality.html
关卡是寻找两边都被三个大字母包围的小字母。
代码可以参考上一小节的。
代码如下:
# -*- coding: UTF-8 -*-
import urllib.request
import re
import string
url = urllib.request.urlopen('http://www.pythonchallenge.com/pc/def/equality.html')
page = url.read().decode('utf8') # 在Python中urlopen返回的response是byte类,需要转成string类
pattern = re.compile(r'<!--[^>]*?-->') # 注释是在<!-- 和-->,这里使用?是想最短匹配,不过好像不加也没有影响
m = re.findall(pattern, page)
#print(m)
pattern = re.compile(r'(?<=[a-z][A-Z]{3})([a-z])(?=[A-Z]{3}[a-z])')
print(''.join(re.findall(pattern, ''.join(m))))
这段代码主要是考察re正则表达式的使用,其中(?<=…)是前缀匹配,但是不捕获,(?=…)是后缀匹配,也是不捕获。
最后一段输出代码,有很多括号,不可取,这主要是由于re.findall返回的序列[],要用”.join()来转换成string输出,或许有更好的方式来实现。