python scrapy爬虫

由于工作需要,需要做对数据分析和收集有一定了解,于是自己准备收集数据做点小东西。自己的电脑是windows平台下,尝试过用php,但单线程,太慢了。于是转投python,写下自己的流程吧,供大家分享

虽然python最新的已经是python 3.5了,但是因为python2和python3不兼容,很多python库都无法使用了,所以scrapy目前最主流的仍然是基于2.7版本,有兴趣的童鞋可以自己研究python3版本的scrapy。

一、安装python 2.7

《python scrapy爬虫》 安装过程g

  • 检查是否安装成功
    开发cmd,输入python,看到如图所示就说明安装成功了

《python scrapy爬虫》 安装成功

二、安装Twisted

下载地址:http://twistedmatrix.com/trac/wiki/Downloads

《python scrapy爬虫》 Paste_Image.png

一直下一步下一步就可以了

《python scrapy爬虫》 安装成功

三、安装setuptools

下载地址:http://pypi.python.org/pypi/setuptools

《python scrapy爬虫》 Paste_Image.png

一直下一步下一步就可以了,这里就不截图了

四、安装zope

《python scrapy爬虫》 Paste_Image.png

  • 命令行中执行以下命令
    C:\>cd Python27\Scripts C:\Python27\Scripts>easy_install.exe zope.interface-3.8.0-py2.7-win32.egg
  • 就可以成功得到如图所示的内容表明安装完成

《python scrapy爬虫》 Paste_Image.png

  • 验证是否安装成功,通过python引用看看是否报错,正常情况如下

《python scrapy爬虫》 Paste_Image.png

五、安装w3lib

《python scrapy爬虫》 Paste_Image.png
《python scrapy爬虫》 Paste_Image.png

  • 验证一下安装成功了没有,成功如下,正常被引用

《python scrapy爬虫》 Paste_Image.png

六、 安装libxml2

《python scrapy爬虫》 Paste_Image.png

  • 验证是否安装成功,引用成功,我们继续

《python scrapy爬虫》 Paste_Image.png

七、安装pyOpenSSL

《python scrapy爬虫》 Paste_Image.png

  • 验证是否安装成功

《python scrapy爬虫》 Paste_Image.png

八、最后一步安装Scrapy

《python scrapy爬虫》 Paste_Image.png
《python scrapy爬虫》 Paste_Image.png

  • 验证安装,直接输入scrapy。查看运行结果,如下

《python scrapy爬虫》 Paste_Image.png

下一期就给开始正式写爬虫了,敬请期待

点赞