Python爬虫教程-01-爬虫介绍

2024年1月1日 222次阅读来源: NicePython

Python 爬虫的知识量不是特别大，但是需要不停和网页打交道，每个网页情况都有所差异，所有对应变能力有些要求

爬虫定义：网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫

1、通用爬虫：

不分类，比如百度搜索引擎，我们通过百度输入数据，获取百度爬虫从各种网站爬到的数据、

2、专用爬虫（聚焦爬虫）：

就是我们介绍的，关于某一类的数据，比如说，需要爬智联招聘网站，某地区的招聘信息

———————

作者：肖朋伟

原文：

    原文作者：NicePython
    原文地址: https://zhuanlan.zhihu.com/p/62246679
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。