lxml库里的etree模块
etree.HTML() 进行初始化,构造解析对象
etree.tostring() 修正后的HTML代码
etree.parse() 读取文本文件进行解析
parent:: 或.. 选取父节点
@进行属性过滤
text() 文本选取
contains() 属性多值匹配
and等运算符 多属性匹配
索引进行按序选择
节点轴:
ancestor:: 祖先
attribute:: 属性
child:: 直接子节点
descendant:: 所有子孙节点
following:: 当前结点之后的所有节点
following-sibling:: 当前结点之后的所有同级结点