批量抓取公众号数据(阅读数点赞数在看数留言数),批量下载备份公众号文章导出pdf
视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数
批量抓取下载公众号文章我是通过抓包用python下载的,下载效果如图:

下载的文件有文章内容html文件,文章链接markdown文件,文章数据excel文件,数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数等,比如深圳卫健委这个号的阅读数都是10万+。

文章下的留言内容也可以下载到excel(主要包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间等等),比如深圳卫健委在2月份就有1万6千多条留言,每篇文章几乎都是100条留言。

为了方便查找下载的文件,这次把下载的音频保存在audio目录,视频保存在video目录,封面保存在cover目录,图片保存在images目录,文章内容保存在html目录。


下载的文章内容html可以用我开发的html2pdf批量转换为pdf,批量转换后的pdf文件保存在pdf目录:
然后用我开发的pdf_merge.exe合成一个pdf文件苏生不惑又写了个pdf合并带书签小工具 ,效果:

最后将所有公众号文章导出一个pdf,文件名为书签,点击会跳转对应文章。


另外为了方便翻所有历史文章,部分公众号同步到了博客,不用在手机上翻历史文章了 ,比如深圳卫健委从2014到2022发布1万多篇文章,第一篇文章很快可以找到:
