2023批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel
2023年我写了个脚本批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel,以莫言老师的公众号为例,批量音频效果如图:

文章内容是html文件,可以用谷歌浏览器打开。

html再批量转换成pdf文件。

将转换后的pdf再合并成一个pdf文件并生成书签 :


文章下的留言合并在pdf 里,点击左侧文章书签可以跳转到对应文章:



除了下载文章内容还有文章数据,主要包含文章日期,标题,链接,简介,作者,封面图,是否原创,IP归属地,阅读数,在看数,点赞数和留言数,赞赏数,视频数,音频数等等,我之前抓取过深圳卫健委的公众号数据我抓取了所有文章标题和阅读数分析了下,看阅读数都是10万+,厉害了。
