批量下载微博评论并分析ip归属地
以最近大火的刘耕宏这条微博为例。

先抓取微博评论数据,包含评论时间,评论用户昵称,评论内容,点赞数和ip归属地等:

打开工具,输入微博mid和微博cookie就行:

微博评论内容的词云图:

再用python统计IP归属地的占比图,来自广东和上海的最多:
import requests,re,csv,time,random,pandas as pd
import numpy as np
from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.charts import Pie
def ipData(mid):
df = pd.read_csv(f"{mid}.csv",encoding='utf-8')#,on_bad_lines='skip'
df2=df.ip归属地.value_counts().sort_values(ascending=False).head(10)
ip = df2.index.tolist()
counts = df2.values.tolist()
bar = (
Bar()
.add_xaxis(ip)
.add_yaxis("", counts)
)
pie = (
Pie()
.add("", [list(z) for z in zip(ip, counts)],radius=["40%", "75%"], )
.set_global_opts(title_opts=opts.TitleOpts(title="饼图",pos_left="center",pos_top="20"))
.set_global_opts(legend_opts=opts.LegendOpts(type_="scroll", pos_left="80%", orient="vertical"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"), )
)
pie.render(str(mid) +'.html')

另外微博转发数据的抓取可以用chrome扩展web scraper 不用写代码,Chrome 扩展神器 web scraper 抓取知乎热榜/话题/回答/专栏,豆瓣电影 ,还是以刘耕宏这条微博的转发为例 ,设置3个选择器:微博昵称,微博评论,评论时间。

看下抓取数据没问题。

最后导出excel文件:

如果还想分析微博正文看我之前文章一键批量下微博内容/图片/视频,获取博主最受欢迎微博,图片查找微博博主 ,比如李健微博每个月的转发评论赞数总和。

原创微博和转发比例。

发微博来源占比:
