python 爬虫获取网页图片

#抓取百度贴吧的图片   

# 网址:http://tieba.baidu.com/p/4775824848
#注意:不同的网址它的图片的正则表达式是不同的,可以在其网页源码查找,根据图片位置
##相关资料:点击打开链接

import urllib.request import re import os def fetch_pictures(url): html_content = urllib.request.urlopen(url).read() r = re.compile('<br><img class="BDE_Image" src="(.*?)"') picture_url_list = r.findall(html_content.decode('utf-8')) os.mkdir('photos') os.chdir(os.path.join(os.getcwd(), 'photos')) for i in range(len(picture_url_list)): picture_name = str(i) + '.jpg' try: urllib.request.urlretrieve(picture_url_list[i], picture_name) print("Success to download " + picture_url_list[i]) except: print("Fail to download " + picture_url_list[i]) if __name__ == '__main__': fetch_pictures("http://tieba.baidu.com/p/4775824848")

#图片保存在photos文件夹中,结果如图所示 Lana Del Rey

《python 爬虫获取网页图片》

##当改变网址时,需要注意更改正则表达式,因为搜索图片的页面网址源代码中的图片属性可能会不同,重新设定正则表达式即可。

    原文作者:ksy_e
    原文地址: https://blog.csdn.net/kunshanyuz/article/details/53386142
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞