欢迎光临散文网 会员登陆 & 注册

《双城之战》口碑爆炸,却有评论说它不如国漫?Python采集好评、中评、差评,看它真有

2021-11-29 15:13 作者:松鼠爱吃饼干  | 我要投稿

前言

上次爬了《双城之战》的视频弹幕,效果很不理想,这次的目标是豆瓣的评论数据

分别把好评、一般和差评都一起爬下来


知识点

  • 爬虫基本流程

  • requests

  • 制作词云

  • jieba

  • imageio

  • wordcloud

环境

  • Python 3.8

  • pycharm 2021.2

代码实现部分

  • 发送请求

  • 解析数据

  • 保存数据

  • 制作词云图

评论爬虫代码

导入模块


请求数据

先打开开发者工具找到数据




解析数据


翻页

找到不同页数的规律,用for page进行翻页




保存数据


实现效果



词云代码

导入模块


导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片


读取文件内容


jiabe 分词 分割词汇


词云图设置


给词云输入文字


词云图保存图片地址


全部评论词云图


好评词云图


一般词云图


差评词云图




《双城之战》口碑爆炸,却有评论说它不如国漫?Python采集好评、中评、差评,看它真有的评论 (共 条)

分享到微博请遵守国家法律