欢迎光临散文网 会员登陆 & 注册

如何通过puppetter实现PDF聚合阅读器初始模型以及产品思维构想

2022-08-22 23:16 作者:雨夜的博客  | 我要投稿

什么是puppeteer?

行业中puppeteer被称为傀儡师,又被称为提线木偶,它是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议 控制 Chrome 或 Chromium 。Puppeteer 默认运行 无头 ,但可以配置为运行完整(非无头)Chrome 或 Chromium。

puppeteer可以做什么?

  • 生成页面的屏幕截图和 PDF。

  • 抓取 SPA(单页应用程序)并生成预渲染内容(即“SSR”(服务器端渲染))。

  • 自动化表单提交、UI 测试、键盘输入等。

  • 创建最新的自动化测试环境。使用最新的 JavaScript 和浏览器功能直接在最新版本的 Chrome 中运行测试。

  • 捕获您网站的 时间线轨迹 以帮助诊断性能问题。

  • 测试 Chrome 扩展程序。

puppeteer和selenium的主要区别?

  • puppeteer是谷歌孵化出来的一个 Node.js 库和浏览器测试框架对geogle浏览器访问权限较好,它主要针对geogle浏览器和它同胞小弟Chromium浏览器、而selenium是有Thoughtworks公司在2004 年推出的。

  • puppeteer开发语言主要是JavaScript、而selenium支持 JavaScript、Java、Ruby、C# 和 Python。为了更好的体现python语言的万金油的作用、非官方版本的puppetter应运而生。

  • 从易用性来说如果对JavaScript有所了解的话,选择puppeteer还是比较好的。当然如果对python语言比较熟悉、像构建完善的自动化工程还是选择selenium。

语言特性和实现

  • nodeJs



  • python3

沧桑巨变、史诗为进

Pdf的处理对于现在场景分析中、是必须常见的、目前国际或者国内做PDF聚合阅读和处理的平台到是不多、中国老牌的福昕阅读器和海外同类的PDF Reader Pro市场都是在阅读上,但是在pdf合并和处理上并没有什么好的平台得以应用、要么收费、要么按次收费。当然今天不讨论这个问题,只是为了写个PDF聚合采集工具。

nodeJs


这是一个简单的产品原型、后期可以加入PDF合并、拆分以及PDF转成图片、图片转PDF、视频格式转换等工具类的工具平台。

思维和共识


如何通过puppetter实现PDF聚合阅读器初始模型以及产品思维构想的评论 (共 条)

分享到微博请遵守国家法律