欢迎光临散文网 会员登陆 & 注册

《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑

2018-05-05 00:16 作者:绝不原创的飞龙  | 我要投稿

在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。

首先,我会介绍pandas的层次化索引,它广泛用于以上操作。然后,我深入介绍了一些特殊的数据操作。在第14章,你可以看到这些工具的多种应用。

8.1 层次化索引

层次化索引(hierarchical indexing)是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。我们先来看一个简单的例子:创建一个Series,并用一个由列表或数组组成的列表作为索引:

In [9]: data = pd.Series(np.random.randn(9),

  ...:                  index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'],

  ...:                         [1, 2, 3, 1, 3, 1, 2, 2, 3]]) In [10]: data 

Out[10]: 

a  1   -0.204708

  2    0.478943

  3   -0.519439

b  1   -0.555730

  3    1.965781

c  1    1.393406

  2    0.092908

d  2    0.281746

  3    0.769023

dtype: float64

看到的结果是经过美化的带有MultiIndex索引的Series的格式。索引之间的“间隔”表示“直接使用上面的标签”:

阅读全文:http://t.cn/Ru3Cltv


《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑的评论 (共 条)

分享到微博请遵守国家法律