一.元素定位
1.有时候也叫Locator,一个HTML页面元素,可以用很多方法去描述这个元素的位置。打个比方,生活中地址,一个大厦,正常的地址是 xx省xx市xx区xx街道xxx号,这个具体描述就是这个大厦的Locator。同样的道理,一个网页元素,也有位置,也可以通过一些手段或者表达式去描述这个元素在页面对应的位置。
二.XPath工具安装
1.打开火狐浏览器,如果没有安装,下载默认安装。
2.点击右上角,菜单-附件组件-扩展。
3.在搜索所有附件组件文本输入框输入:firebug。
4.找到Firebug,点击 安装。重复步骤3和4,搜索和安装FirePath。
5.安装后,会在火狐浏览器右上角显示一个虫子的图标。
三.XPath工具简单使用
①FirePath自动推荐该元素的XPath表达式。
②该元素节点的详细信息,XPath表达式选取重点区域。
③找到一个匹配元素。
1.一般来说,自动推荐的XPath表达式定位不够精确。大部分时候需要去步骤2中,找出能够识别这个唯一元素的节点信息。刚好上面通过id=kw只能找到一个匹配的元素,说明这个XPath可用,看起来也简洁。实际项目中,可能XPath表达式写得很长,或者附近节点信息好多相同,不太好能够快速找到一个唯一的节点信息去定位这个目标元素。
四.XPath定位技巧之text()方法
五.XPath定位技巧之contains()方法
1.有时候不喜欢写很长的XPath表达式,而且节点信息里面,有些信息是动态的,每次都获取都不一样,这个时候contains()方法就很好用。
2.用contains()方法来定位>
3.这里href = //diannao.jd.com, 如果觉得这个href太长,只取关键字diannao,利用contains()方法来定位就方便多,推荐电脑这个元素的XPath://*/a[contains(@href,‘diannao’)]
六.相对XPath路径写法
1.有时候遇到目标元素节点的信息很少,不足够用来精确定位到目标元素,这个时候就需要考虑,利用目标元素上下附件节点,通过确定附件的节点从而确定目标元素,这种方式就叫相对路径。

2.这里推荐的XPath是根据目标元素节点中id信息来定位的,这个通过id就能定位,当然好。
3.有时候,如果这个id不能作为参考值,需要利用相对定位方法来定位这个新闻标题前面的单选按钮。
3.1.先根据value = google_web 或者text()=谷歌来定位“谷歌”这个标签。
3.2.根据相对定位来确定“谷歌”前面的这个radio按钮。
3.3.XPath的写法是:.//*/label[@value=‘google_web’]/
七.绝对路径定位
1.最简单和直观的就是写元素的绝对路径。如果仍然把一个元素看做一个人的话,那么现在有一个人,他没有任何属性特征,那么这个人一定会存在于某个地理位置,如:xx 省 xx 市xx 区 xx 路 xx 号。那么对于一个元素在一个页面当中也会有这样的一个绝对地址。
2.find_element_by_xpath("/html/body/div/div[2]/div/div/div/from/span/input")
3.find_element_by_xpath()方法用于 XPath 语言定位元素。XPath的绝对路径主要用标签名的层级关系来定位元素的绝对路径。最外层为 html 语言,body 文本内,一级一级往下查找,如果一个层级下有多个相同的标签名,那么就按上下顺序确定是第几个,div[2]表示第二个 div 标签。
八.利用元素属性定位
1.XPath也可以使用使素的属性值来定位。
find_element_by_xpath("//input[@id='kw']")
find_element_by_xpath("//input[@id='su']")
2.//表示当前页面某个目录下,input 表示定位元素的标签名,[@id=‘kw’] 表示这个元素的 id 属性值等于kw。下面通过 name 和 class 属性值来定位。
find_element_by_xpath("//input[@id='wd']")
find_element_by_xpath("//input[@class='s_ipt']")
3.find_element_by_xpath("//[@class=‘bg s_btn’]")
如果不想指定标签名也可以用星号()代替。当然,使用 XPath 不仅仅只局限在 id、name 和 class 这三个属性值,元素的任意属性值都可以使用,只要它能唯一的标识一个元素。
find_element_by_xpath("//input[@maxlength='100']")
find_element_by_xpath("//input[@autocomplete='off']")
find_element_by_xpath("//input[@type='submit']")
九.层级与属性结合定位
1.如果一个元素本身并没有可以唯一标识这个元素的属性值,我们可以找其上一级元素,如果它的上级有可以唯一标识属性的值,也可以拿来使用。
1.假如百度输入框本身没有可利用的属性值,可以查找它的上一级属性。比如,“小明”刚出生的时候没有名字,没上户口(没身份证号),那么亲朋好友来找“小明”可以先到小明的爸爸,因为他爸爸是有很多属性特征的,找到了小明的爸爸,抱在怀里的一定就是小明。
find_element_by_xpath("//span[@class='bg s_ipt_wr']/input")
2.find_element_by_xpath(“//span[@class=‘bg s_btn_wr’]/input”)span[@class=‘bg s_ipt_wr’] 通过 class 属性定位到是父元素,后面/input 也就表示父元素下面标签名为input 的子元素。如果父元素没有可利用的属性值,那么可以继续向上查找“爷爷”元素。
find_element_by_xpath("//form[@id='form']/span/input")
3.find_element_by_xpath(“//form[@id=‘form’]/span[2]/input”)
我们可以通过这种方法一级一级的向上打找,直到找到最外层的标签,那么就是一个绝对路径的写法了。
十.使用逻辑运算符定位
1.如果一个属性不能唯一的区分一个元素,我们还可以使用逻辑运算符连接多个属性来区别于其它属性。
2.如上面的三行元素,假如现在要定位第一行元素,如果使用 id 将会与第二行元素重名,如果使用class 将会与第三行元素的重名。那么如果同时使用 id 和 class 就会唯一的标识这个元素。那么这个时候就可以通过逻辑运算符号连接。
find_element_by_xpath("//input[@id='kw' and @class='su']/span/input")
3.当然也可以用 and 连接更多的属性来唯一的标识一个元素。