Python爬取豆瓣Top250并可视化(一) —— 保存数据到Excel —— openpyxl
前面做了第一篇关于保存爬虫数据的文章,用的是xlwt。今天来第二弹,用openpyxl进行保存。思路都差不多,先爬取数据,然后用openpyxl进行保存。代码如下:

与xlwt比较,细节之处有几点:
1,保存到excel的文件名不相同,xlwt保存的是后缀名是xls,而openpyxl保存的是xlsx;
2,虽然处理的爬虫数据都是嵌套列表数据。用xlwt进行保存的时候,处理完完成列表还得提取出内层嵌套列表的单个数据,儿用openpyxl,只需遍历外层列表,然后将每个内层列表当成整体进行append就可以追加到表格;
3,用openpyxl一定要注意I/O问题,说白了就是创建工作簿和保存工作簿之间,一定要夹带所要处理的所有数据,不然很可能保存的时候就剩下25条数据了。
声明:本文仅供学习和交流使用,特别是作者复习。