欢迎光临散文网 会员登陆 & 注册

drissionpage介绍

2023-02-23 14:45 作者:青阳小栈  | 我要投稿

介绍

DrissionPage,即 driver 和 session 的合体,是一个基于 python 的 Web 自动化操作集成工具。


requests 爬虫面对要登录的网站时,要分析数据包、JS 源码,构造复杂的请求,往往还要应付验证码、JS 混淆、签名参数等反爬手段,门槛较高。若数据是由 JS 计算生成的,还须重现计算过程,体验不好,开发效率不高。使用 selenium,则可以很大程度上绕过这些坑,但 selenium 效率不高。


因此,这个库将 selenium 和 requests 合二为一,不同需要时切换相应模式,并提供一种人性化的使用方法,提高开发和运行效率。除了合并两者,本库还以网页为单位封装了常用功能,简化了 selenium 的操作和语句,在用于网页自动化操作时,减少考虑细节,专注功能实现,使用更方便。

因此,这个库将 selenium 和 requests 合二为一,不同需要时切换相应模式,并提供一种人性化的使用方法,提高开发和运行效率。除了合并两者,本库还以网页为单位封装了常用功能,简化了 selenium 的操作和语句,在用于网页自动化操作时,减少考虑细节,专注功能实现,使用更方便。


特性:


允许在 selenium 和 requests 间无缝切换,共享 session。


2. 两种模式提供一致的 API,使用体验一致。


3. 人性化的页面元素操作方式,减轻页面分析工作量和编码量。


4. 对常用功能作了整合和优化,更符合实际使用需要。


5. 兼容 selenium 代码,便于项目迁移。


6. 使用 POM 模式封装,便于扩展。


7. 统一的文件下载方法,弥补浏览器下载的不足。


8. 简易的配置方法,摆脱繁琐的浏览器配置。



安装

安装drissionpage包,如果遇到问题应该是网络问题

可以设置超时时间来尝试解决

pip install DrissionPage  --default-timeout=1000


使用

具体事项参考

http://g1879.gitee.io/drissionpagedocs/


drissionpage介绍的评论 (共 条)

分享到微博请遵守国家法律