图片抓取与存储
注意文件名和存储位置。
import requests
url='https://img3.doubanio.com/view/photo/s_ratio_poster/public/p480747492.webp'
res=requests.get(url)
img=res.content
with open( 'data/test.webp','wb' ) as f:
f.write(img)
print('OK')
代理使用
可以使用西刺免费代理IP获得代理地址和端口号,注意经常不稳定无法连接,还要注意优先改为http而不是https。
import requests
from bs4 import BeautifulSoup
import time
url='https://movie.douban.com/top250'
proxy = {
'http': 'http://119.101.113.239:9999'
}
header = {
'User-agent': 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)',
}
res = requests.get(url,headers=header, proxies=proxy)
soup = BeautifulSoup(res.text)
movies = soup.find_all('div', 'info')
print(movies[0])
每个人的智能新时代
如果您发现文章错误,请不吝留言指正;
如果您觉得有用,请点喜欢;
如果您觉得很有用,欢迎转载~
END