February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
この章では、ブール値マスクを使用してNumPy配列内の値を調べたり操作する方法について説明します。配列内の値を何らかの基準に基づき、抽出、変更、カウントまたはその他の操作を行う場合にマスクを使用します。例えば、ある値よりも大きな値のカウント、しきい値を超えた外れ値の除去などです。NumPyでこれらの作業を行う最も効率的な方法がブール値マスクです。
ある都市の年間降水量を示す一連のデータがあるとします。ここではシアトル市の2015年の日次降水量統計†1をpandas(「Ⅲ部 pandasによるデータ操作」で詳しく説明します)を使用して読み込みます。
[†1] 訳注:降水量統計データは、vaga_datasetsパッケージとして提供されているものを使用するため、vega_datasetsのインストールが必要。pip install vega_datasets(Anacondaを使用している場合には、conda install vega_datasets)を実行する。
In [1]: import numpy as np
from vega_datasets import data
# pandasを使用して降水量(インチ)をNumPy配列として読み込む
rainfall_mm = np.array(
data.seattle_weather().set_index('date')['precipitation']['2015'])
len(rainfall_mm)
Out[1]: 365
この配列は、2015年1月1日から12月31日までの日次降水量をインチ(2.54センチ)単位で表した365個の要素を持ちます。
手始めにMatplotlib(このツールについては ...