最近看小说,总有奇奇怪怪的广告出现,于是想要抓下来慢慢看,于是开始动手:
resp = requests.post(URL + endPoint,headers = headers)
soup = bs(resp.content,'html.parser',from_encoding = 'utf-8')
#抓取文章内容
tag = soup.find('div',id='nr')
tagnext = soup.find('a',id = 'pb_next')
nr = tag.get_text().encode('utf-8')
#获取下一章地址
match = re.match('.*html$',tagnext['href'])
if match is None:
return (nr,None)
return (nr,match.string)
写完后我想,终于可以看小说了,于是我开心的点开我的文件
原文作者:__鲸_
原文地址: https://www.jianshu.com/p/3a407c1636fe
本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。