Python爬取豆瓣Top250并可视化(一) —— 保存数据到Excel —— xlwt
今天看了某招聘平台的Python岗,好多数据分析岗,感觉上,不复习一下Python爬虫和数据可视化就要被淘汰了。于是我来做一期自己复习的材料。
做可视化,得先有数据,所以第一个是爬虫,代码如下:
解释一下思路,方便以后自己复习:
1,请求数据,要请求25次,每次请求都解析网页数据,然后将每次请求得到的网页数据用一个列表存储起来,以供需要的时候直接从内存中调用;
2,写到excel中这里是用的xlwt,下次用openpyxl,相对来说逻辑会简单很多。xlwt建的excel格式是xls的,不是xlsx,然后左上角的第一格是0,0。这个逻辑建议参考一下前面的99乘法表的文章;
3,代码可能存在多次debug,然后会产生I/O问题,将打开的文件关闭试试看。
最后是保存截图:

声明:本文仅供交流学习,特别是作者复习使用。不具备任何其他用途。