有时,看到一些大牛,很想把他们的文章下载下来慢慢的阅读,慢慢品味,闲着蛋疼的时候,写了一个爬虫,把他们的文章下载并保存成了html格式,附上代码,供学习之用。 import requests import re impo…
标签:数据挖掘
CNDS博客文章爬取之tkinter
from tkinter import * import tkinter as tk import tkinter.messagebox as messagebox import tkinter.font import …
CNDS博客文章爬取之多进程
import requests import re import os from multiprocessing import Pool headers = {'User-Agent': 'Mozilla/5.0 (Wi…
CNDS博客爬取之多线程
import requests import re import os import threading headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; W…