scrapy设置随机请求头的两种方法

1.在settings.py中设置USER_AGENT_LIST

需要先导入random模块

《scrapy设置随机请求头的两种方法》

然后在meddlewares.py中创建RandomUserAgentMiddleWare()类.重写scrapy内置的UserAgentMiddleware.

《scrapy设置随机请求头的两种方法》

《scrapy设置随机请求头的两种方法》

这种最后需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

《scrapy设置随机请求头的两种方法》

2.通过pip install fake-useragent,从而直接通过fake_useragent第三方库来随机生成请求头.

需要先导入UserAgent

from fake_useragen timport UserAgent

需要在settings.py中设置

# 用于配置随机user-agent的类型,如果值是random,表示任意随机一个;如果配置的是chrome,则只随机chrome中的user-agent.

RANDOM_UA_TYPE =’chrome’

《scrapy设置随机请求头的两种方法》

《scrapy设置随机请求头的两种方法》

最后同上面一样需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

《scrapy设置随机请求头的两种方法》

    原文作者:june雨上
    原文地址: https://www.jianshu.com/p/ebd07a8d9e59
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞