《双城之战》口碑爆炸,却有评论说它不如国漫?Python采集好评、中评、差评,看它真有
前言
上次爬了《双城之战》的视频弹幕,效果很不理想,这次的目标是豆瓣的评论数据
分别把好评、一般和差评都一起爬下来


知识点
爬虫基本流程
requests
制作词云
jieba
imageio
wordcloud
环境
Python 3.8
pycharm 2021.2
代码实现部分
发送请求
解析数据
保存数据
制作词云图
评论爬虫代码
导入模块
请求数据
先打开开发者工具找到数据

解析数据
翻页
找到不同页数的规律,用for page进行翻页

保存数据
实现效果

词云代码
导入模块
导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片
读取文件内容
jiabe 分词 分割词汇
词云图设置
给词云输入文字
词云图保存图片地址
全部评论词云图

好评词云图

一般词云图

差评词云图
