欢迎光临散文网 会员登陆 & 注册

2023年批量下载公众号文章,导出文章pdf,抓取文章数据含阅读数/点赞数/在看数/留言数

2023-07-22 11:25 作者:苏生不惑  | 我要投稿


2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出html和pdf格式,含阅读数/点赞数/在看数/留言数/赞赏数

经常看公众号文章,于是写了脚本批量抓取下载公众号文章内容/话题/图片/封面/视频/音频,导出文章html和pdf格式,抓取数据含阅读数/点赞数/在看数/留言数/赞赏数等,下载效果如图:

下载的音频保存在audio目录,视频保存在video目录,封面保存在cover目录,图片保存在images目录,文章内容保存在html目录。

第2次下载会跳过已经下载过的文章。

以莫言老师的公众号为例,所有文章合成的pdf效果:

下载的excel文章数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数,视频数,音频数等,比如深圳卫健委2022年的文章阅读数都是10万+,文章数据分析见文章2022年过去,抓取公众号阅读数点赞数在看数留言数做数据分析, 以深圳卫健委这个号为例

文章下的留言内容也可以导出到excel(包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间),比如深圳卫健委在一个月就有1万6千多条留言。

更新版:整理下苏生不惑开发过的那些工具和脚本


2023年批量下载公众号文章,导出文章pdf,抓取文章数据含阅读数/点赞数/在看数/留言数的评论 (共 条)

分享到微博请遵守国家法律