[PySpider]抓取架构

Master

pyspider00

data_db(存储抓取数据)
  • phantomjs
  • scheduler
  • processor
  • –phantomjs-proxy=’localhost:25555′ fetcher
  • result_worker
  • webui

Slave_01

pyspider01

taskdb,projectdb,resultdb(存储主要任务和脚本数据,比较重要)
  • phantomjs
  • processor
  • –phantomjs-proxy=”localhost:25555″ fetcher

Slave_02

pyspider02

  • phantomjs
  • processor
  • –phantomjs-proxy=”localhost:25555″ fetcher
    原文作者:_小老虎_
    原文地址: https://www.jianshu.com/p/3d581e9c5881
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞