圣光的事,怎么能说脏呢。 介绍: 链家对爬虫初学者来说很友好,而且只爬取北京租房信息,数据量极小。 各区房源占比 各区平均月租金和房源数量 月租金的词云 啧啧啧,不容易啊。 顺便看看代码方面,比较简陋。 环境: Pyth…
标签:租房
利用爬虫Scrapy中的LinkExtractor(链接提取器)爬租房信息(全站爬虫)
目标爬取某租房网站的房源信息。首先看一下网页,如下图1,爬北京区域所有的租房信息。 1.jpg 1.2.jpg 从图上可以看到每一条出租房屋信息,主要包括:价格,户型,面积,楼层,装修,类型,所在区,小区,出租方…