欢迎光临散文网 会员登陆 & 注册

快速获取XPath路径的三种方式【爬虫人狂喜】

2022-03-07 15:33 作者:张自信的小号  | 我要投稿

法一——检查+复制:

到达含所需信息的网页——右键——检查——选择网页中的相应元素即可进行检查——代码定位到所需信息的标签——选中该标签点击鼠标右键——复制——复制XPath即可。


之后可以用XPath Helper插件对获得的XPath进行检查。结果一栏有想要的信息即说明解析正确。

路径检查


法二——Quicker软件动作:

Quicker软件动作库扩展——“快速获取CSS”

按“Ctrl”出现界面——选中要获取信息——复制XPath

该法获得的XPath路径有些冗长,如:

.//*[contains(concat(" ",normalize-space(@class)," ")," xh-highlight ")]备选分隔标记//*[contains(concat( " ", @class, " " ), concat( " ", "xh-highlight", " " ))]备选分隔标记//*[@id="content"]/div[1]/div[1]/div[5]/span[1]/a[1]

 

保留第二个“备选分隔标记”之后的部分部分(如下图),其他删除即可。


之后可以用XPath Helper插件对获得的XPath进行检查。

Quicker软件动作库扩展参考:

https://getquicker.net/Sharedaction?code=7220dfb5-21ab-41c8-0deb-08d8337898d1

 

法三——暴力解析:

暴力分析获取XPath,对XPath解析足够了解并且能快速分析得到的话可以通过分析网页内容来获取XPath路径。

 

附:

XPath Helper插件获取教程:

https://www.bilibili.com/video/BV1Db4y1m7Ho?p=69

XPath的基本使用:

https://www.bilibili.com/video/BV1Db4y1m7Ho?p=70


快速获取XPath路径的三种方式【爬虫人狂喜】的评论 (共 条)

分享到微博请遵守国家法律