
234
第 8 章
数据规整:连接、联合和重塑
在许多应用中,数据可能分散在多个文件或数据库中,或者排列的形式不利于分析。本
章关注的是连接、联合、重塑数据的方法。
首先,我会介绍
pandas
的层次化索引,它广泛用于以上操作。然后,我将深入介绍一些
特殊的数据操作。在第
13
章,读者可以看到这些工具的具体运用。
8.1
层次化索引
层次化索引是
pandas
的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引
层级。用另一种说法,它使你能以低维度形式处理高维度数据。我们先来看一个简单的
例子:创建一个
Series
,并用一个由列表(或数组)构成的列表作为索引:
看到的结果是以 MultiIndex 作为索引的经过美化的
Series
视图。索引之间的“间隔”
表示“直接使用上面的标签”: