xpath contains_XPath

1、什么是XPah

1.解析XML的一种语言(html其实是XML的子级),广泛用于解析html数据

2.几乎所有语言都能用XPath

3.除了XPath还有其他手段用于XML解析,比如:BeautifulSoup、lxml、DOM等等

2、XPath语法

XPath语法归纳起来就是三大类:

  • 层级:/ 直接子级 、 // 跳级
  • 属性:@ 属性访问
  • 函数:contains() 、 text() 等

3、使用XPath

1.在浏览器中使用

如下图所示:

v2-0970ec4a517f6717b70a265cccb94929_b.jpg

我们随便找一个网页去用xpath去检索,审查元素

v2-40c00555e74063fa38b1544124c6ebd7_b.jpg

通过//div[@class="c-row c-gap-top"]//div[contains(@class,"c-gap-top-small")] 这个xpath路径就可以查找到4个相关语言的标题内容,其中这个xpath路径跳级用//,下一级用/。

2.scrapy爬虫框架中使用(这里可以查看以下一篇文章)

空心人:Scrapy爬虫框架​zhuanlan.zhihu.com
v2-bfe423521bc0dab81a0a3ec44eb8db09_180x120.jpg