
172
5
章
pandas
入門
In [229]: df.loc['b']
Out[229]:
0 1 2
b 1.669025 -0.438570 -0.539741
b 0.476985 3.248944 -1.021228
5.3
要約統計量の集計と計算
pandas
オブジェクトでは、一般的な数学的、統計的なメソッドが使えます。これらのメソッドのほ
とんどは、集約や要約統計量に分類されるようなものです。これらのメソッドでは、データフレームの
行や列にあるシリーズから合計値や平均値などの
1
つの値を計算します。
NumPy
配列と違い、これら
のメソッドは欠損値を扱う機能が組み込まれています。小さなデータフレームで例を見てみましょう。
In [230]: df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],
.....:
[np.nan, np.nan], [0.75, -1.3]],
.....: index=['a', 'b', 'c', 'd'],
.....: columns=['one', 'two'])
In [231]: df
Out[231]:
one two
a 1.40 NaN
b 7.10 -4.5
c NaN NaN
d 0.75 -1.3
データフレームの
sum
メソッドを呼ぶと、特定の列内に含まれる要素の合計値を含むシリーズが戻さ
れます。
In [232]: df.sum()
Out[232]:
one 9.25
two -5.80
dtype: float64 ...