import urllib
#导入模块
url = "http://www.123.com.cn"
#网址参数赋给urlhtml = urllib.urlopen(url)
#用urlopen方法,打开网址并赋给htmlprint html.read().decode("gbk").encode("utf-8")
#读取html内容并打印,把gb2313、gbk编码转为utf-8print html.info()
#打印网页的头部信息print html.getcode()
#打印网页状态码print html.geturl()
#打印输入的urlurllib.urlretrieve(url,"c:\\Users\\Administrator\\Desktop\\test.txt")
#保存URL源代码至指定位置html.close()
#关闭,必须操作
推荐一本书《http权威指南》
一个小例子:
url = raw_input(“url:”) #输入url
#url = “http://www.123.com.cn/”
open_url = urllib.urlopen(url) #打开url并赋值给open_url
#print open_url.read()
print open_url.info() #获取头部信息
#print open_url.getcode()