欢迎光临散文网 会员登陆 & 注册

2023 年批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel

2023-07-21 22:16 作者:苏生不惑  | 我要投稿

原文:

视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数

批量下载公众号文章是通过抓包用python下载的,我之前的文章说过,有空再写篇抓包的文章,下载效果:

下载的文件有文章内容html,文章链接markdown,文章数据excel,数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数等,比如深圳卫健委这个号的阅读数都是10万+。

为了方便找文章,部分公众号的历史文章同步到我的博客,不用在手机上翻历史文章了 ,比如深圳卫健委从2014到2022年发布了1万多篇文章,第一篇文章是这个:

文章下的留言内容也可以下载到excel(包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间等),比如深圳卫健委在2月份就有1万6千多条留言。

说完文章数据然后是下载的文章内容,包括图片/封面/视频/音频,批量下载图片效果:


下载的图片文件名为文章发布时间加文章标题和数字,方便查看:

批量音频效果如图,由于视频比较大,只下载了视频链接,可以用idm二次下载:

文章内容是html文件,可以用谷歌浏览器打开,html再批量转换成pdf。


将转换后的pdf再合并成一个文件并生成书签 苏生不惑又写了个pdf合并带书签小工具


文章下的留言也在pdf文件里,点击左侧书签可以跳转到对应文章:

最后再说下我开发的公众号文章下载工具更新版:整理下苏生不惑开发过的那些工具和脚本 ,可以下载单篇文章/话题下的文章/音频/视频,由于是python3.9开发的,不支持Windows7。

输入公众号文章链接,批量下载文章里的音频效果图:

效果图:

顺便把文章内容也下载到html了,如果有bug可以向我反馈:


2023 年批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel的评论 (共 条)

分享到微博请遵守国家法律