1、什么是XPah
1.解析XML的一种语言(html其实是XML的子级),广泛用于解析html数据
2.几乎所有语言都能用XPath
3.除了XPath还有其他手段用于XML解析,比如:BeautifulSoup、lxml、DOM等等
2、XPath语法
XPath语法归纳起来就是三大类:
- 层级:/ 直接子级 、 // 跳级
- 属性:@ 属性访问
- 函数:contains() 、 text() 等
3、使用XPath
1.在浏览器中使用
如下图所示:

我们随便找一个网页去用xpath去检索,审查元素

通过//div[@class="c-row c-gap-top"]//div[contains(@class,"c-gap-top-small")] 这个xpath路径就可以查找到4个相关语言的标题内容,其中这个xpath路径跳级用//,下一级用/。
2.scrapy爬虫框架中使用(这里可以查看以下一篇文章)
空心人:Scrapy爬虫框架zhuanlan.zhihu.com