爬虫练手：使用scrapy shell返回403错误的解决办法

2019年6月11日 276次阅读来源: BlueCat2016

今天练手爬取这个页面：https://book.douban.com/tag/%E7%BC%96%E7%A8%8B
的过程中，用scrapy shell测试xpath写得是否准确，没想到返回403错误，如下图所示：

《爬虫练手：使用scrapy shell返回403错误的解决办法》图片.png

问了万能的百度，原来是豆瓣采取了反爬机制（当然对于scrapy shell也不例外），所以，只能在使用shell的时候也同样考虑一些“反-反爬”的办法。

当然，首先是要考虑设置user agent.如下图所示：

《爬虫练手：使用scrapy shell返回403错误的解决办法》图片.png

终于可以了！

    原文作者：BlueCat2016
    原文地址: https://www.jianshu.com/p/b449bca53ee3
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。