Python爬虫的post请求简单实例

2019年6月16日 279次阅读来源: chen_ke_hao

登陆网页注册时用Python进行post请求，代码

首先查看页面源代码，注意form表单部分，哪里是需要递交的表单信息

《Python爬虫的post请求简单实例》

运行代码

import urllib.request
import urllib.parse
url='http://www.iqianyue.com/mypost'
postdata=urllib.parse.urlencode({'name':'chenkehk','pass':'316107'}).encode('utf-8')#用字典保存索要注册的信息并用urlencode编码，使用encode（）设置utf-8编码格式
r=urllib.request.Request(url,postdata)
r.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')#模仿浏览器爬取，添加包头信息
data=urllib.request.urlopen(r).read()
f=open('D:/AuI18N/1.html','wb')
f.write(data)
f.close()

成功爬取网页并自动递交表单信息，完成post请求

关于代理服务器的设置

可以到http://www.xicidaili.com/这个地方找

代码：

import urllib.request
import urllib.parse

def u(p_add,url):
    p=urllib.request.ProxyHandler({'http':p_add})#设置代理服务器信息，
    openr=urllib.request.build_opener(p,urllib.request.HTTPSHandler)#构造一个对象，参数是代理信息和urllib.request.HTTPSHandler类
    urllib.request.install_opener(openr)#创建全局默认的openrd对象
    data=urllib.request.urlopen(url).read().decode('utf-8')#打开网址，爬取内容
    return data
p_add='111.155.116.240:8123'
data=u(p_add,'http://www.baidu.com')
print(len(data))

Debuglog日志，在爬取网页的同时打印调试日志，代码：

import urllib.request
import urllib.parse

httphd=urllib.request.HTTPHandler(debuglevel=1)
httpshd=urllib.request.HTTPSHandler(debuglevel=1)
openr=urllib.request.build_opener(httphd,httpshd)
urllib.request.install_opener(openr)
data=urllib.request.urlopen('http://edu.51cto.com')

如何查找登陆界面的，用户名密码字段，以下为例


在构造表单是可以建一个字典

"username":"chenkehao"

"password":"1111"

然后递交表单即可

《Python爬虫的post请求简单实例》

    原文作者：chen_ke_hao
    原文地址: https://blog.csdn.net/chen_ke_hao/article/details/78145373
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。