
128
3
章
pandas
を使ったデータ操作
一般的なパターンが作れます。こうして、使い慣れた
1
次元の
Series
または
2
次元の
DataFrame
オ
ブジェクト内で、高次元のデータがコンパクトに表現できます。
この節では、
MultiIndex
オブジェクトを直接作成する方法について説明します。インデクスの
指定方法、スライス、そして複数のインデクスを持つデータの統計を計算する際に必要となる考慮
事項を取り上げ、単純なインデクス表現と階層型インデクス表現のデータを変換する機能を示しま
す。
いつものように、最初に標準的な
import
を行います。
In[1]: import pandas as pd
import numpy as np
3.6.1
多重インデクスを持つ
Series
最初に、
1
次元の
Series
内で
2
次元データを表現する方法を検討してみましょう。具体的には、
各要素が文字と数値キーを持つ一連のデータを扱います。
3.6.1.1
誤った手法
米国の州に関するデータで、異なる年の値を管理することを考えます。既に説明した
pandas
の
機能を使用するなら、単純にタプルをキーとして使用してしまうかもしれません。
In[2]: index = [('California', 2000), ('California', 2010),
('New York', 2000), ('New York', 2010),
('Texas', 2000), ('Texas', 2010)]
populations = [33871648, ...