基于Python+selenium+Chrome的网页自动化教程
Python版本:Python2.7
Selenium版本:selenium3
Chrome版本:
浏览器驱动(chromedriver)版本:
Python的安装
Python下载链接:https://www.python.org/
python安装完成后 ctrl+R输入cmd进入命令行界面,输入Python再按回车,如果出现Python版本信息则安装成功
Python安装selenium分为在线安装和离线安装。
离线安装:
Selenium下载链接:https://pan.baidu.com/s/1fvX-ZUbQNQpLbUV7SEb71A 密码:pnya
安装步骤:
1、 将selenium文件拷贝到Python的安装目录的Scripts目录下,在顶部导航栏输入cmd再按回车进入命令行界面,
2、 输入pip install selenium-3.11.0-py2.py3-none-any.whl 进行安装,可能会出现pip版本不适用的情况,忽略掉就行了。
3、 安装完成后输入pip list查看是否安装成功
在线安装:
1、 ctrl+R进入命令行界面
2、 输入pip install selenium,点击回车
3、 完成下载、安装
4、 输入pip list 查看是否安装成功
驱动下载:
驱动版本与谷歌浏览器的版本相关,先查看自己电脑中安装的Chrome浏览器版本,然后根据版本号下载对应的驱动,可能有多个驱动适配该版本的浏览器,随便下一个就行了。
下载链接:http://chromedriver.storage.googleapis.com/index.html
编码:
1、 创建一个目录,命名为atuotest
2、 在autotest下创建一个名为res的目录,将驱动拷贝进去
3、 在autotest目录下点击鼠标右键新建一个文本文件,修改名称为“main.py”,一定要将后缀改为“py”
运行脚本:
在autotest目录地址栏中输入“cmd”进入命令行界面,输入“Python main.py”点击回车即可开始运行脚本
Python基础:
Python支持面向对象编程和面向过程编程。为了简单,我们下面写的都是面向过程编程。
Python基础教程:http://www.runoob.com/python3/python3-tutorial.html
代码结构可见:python.jpg
网页知识基础:
HTML:网页结构
HTML基础教程:http://www.runoob.com/html/html-tutorial.html
CSS:网页样式,比如长宽、背景等
JavaScript:动画效果、页面更新
Selenium基础:
1、 定位页面元素的方法
find_element_by_name() – 通过元素的name来查找元素
find_element_by_class_name() – 通过class 来查找
find_element_by_tag_name() – 通过元素的类型来查找,一般不用这种方式
find_element_by_link_text() – 通过链接地址来查找元素
find_element_by_partial_link_text()
find_element_by_xpath() – 通过xpath来查找元素
find_element_by_css_selector() – 通过css样式来查找元素
如图,百度输入框有“id”、“name”、“class”等属性,所以查找这个输入框元素可以任选其一进行查找
如果想要点击“视频”这个链接,可以发现这个链接有“href”、“name”、“class”等属性,可以通过find_element_by_link_text()查找href来定位这个元素,同样也可以用name、class来定位
2、 操作元素
clear() – 清除元素内容,一般是清除输入框中的数据
send_keys() – 在元素中模拟按键输入
click() – 点击元素
submit() — 提交表单
text() – 获取该元素的文本信息
get_attribute(name) – 获取该元素name属性的值
3、 鼠标事件
context_click() – 点击右键
double_click() – 双击鼠标