欢迎光临散文网 会员登陆 & 注册

pandas数据透视实例:商业交易表、全球游戏销量表

2023-07-31 08:59 作者:矢来美羽MIUYARAI  | 我要投稿

1. 宽数据/窄数据的概念

宽数据:在这样一个表格中可以不断增加Name

窄数据:在这样一个表格中可以不断增加Date

两者各有优劣,也可相互转换。

2. 数据透视表pivot

数据透视表是什么意思?可以先参考Excel中的阐述:使用数据透视表汇总数据,可以方便地排列和汇总复杂数据,以便进一步查看详细信息。

一个功能就是宽/窄数据的切换:(筛选、行变列、列变行、汇总值等,下文中将提到的pivot_table()函数

还有一个功能就是pivot的统计方式的相关功能(包括求和sum()、计数count()等):(下文中将提到的aggfunc参数

看一个Python示例:

导入数据:商业交易表sales_by_employee.csv

聚合/汇总:pivot_table()(默认为平均mean,还可以设为sum、count、max、median等)

指定为某一列:

将列设为Name:columns = "Name"

将NaN设为0:fill_value = 0

设置边界的汇总:margins = True

可以用列表/字典传入多个:

3. 行列索引的互相移动

列索引变行索引:.stack()

索引变索引:.unstack()

4. 宽数据变窄数据

宽数据:全球游戏销量表video_game_sales.csv

变成窄数据:.melt()

使用pivot_table()直接聚合每个游戏所有地区的销售总额:

5. 宽列表变窄数据

宽列表食谱:recipes.csv

将成分字符串拆分为列表:.split()

将列表形式的Series拆分为窄数据Series:.explode()


pandas数据透视实例:商业交易表、全球游戏销量表的评论 (共 条)

分享到微博请遵守国家法律