Scrapy是一个爬虫框架 20190519

2019年6月11日 216次阅读来源: YY_3554

《Scrapy是一个爬虫框架 20190519》

scrapy -h startproject, genspider,settings,crawl,list,shell

1:建立一个爬虫工程和模板: scrapy startproject BaiduStocks

2：编写spider : cd BaiduStocks scrapy genspider example example.com

3：编写 item pipeline

4：优化配置策略

request 类 class scrapy.http.Reqeust() 属性和方法：.url, .method, .headers, .body, .meta, .copy()

response类 class scrapy.http.Response()属性和方法：.url, .status, .headers, .body, .flags, .request, .copy()

scrapy 支持多种html解析方法：Beatiful Soup, lxml, re, XPath Selector, CSS Selector.

def gen(n):

for i in range(n):

yield i**2

《Scrapy是一个爬虫框架 20190519》

    原文作者：YY_3554
    原文地址: https://www.jianshu.com/p/3964bf2621e0
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。