Skip to Content
Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

9章比較、マスク、ブール論理

この章では、ブール値マスクを使用してNumPy配列内の値を調べたり操作する方法について説明します。配列内の値を何らかの基準に基づき、抽出、変更、カウントまたはその他の操作を行う場合にマスクを使用します。例えば、ある値よりも大きな値のカウント、しきい値を超えた外れ値の除去などです。NumPyでこれらの作業を行う最も効率的な方法がブール値マスクです。

9.1 事例:雨天日数

ある都市の年間降水量を示す一連のデータがあるとします。ここではシアトル市の2015年の日次降水量統計†1をpandas(「Ⅲ部 pandasによるデータ操作」で詳しく説明します)を使用して読み込みます。

[†1] 訳注:降水量統計データは、vaga_datasetsパッケージとして提供されているものを使用するため、vega_datasetsのインストールが必要。pip install vega_datasets(Anacondaを使用している場合には、conda install vega_datasets)を実行する。

In [1]: import numpy as np
        from vega_datasets import data

        # pandasを使用して降水量(インチ)をNumPy配列として読み込む
        rainfall_mm = np.array(
            data.seattle_weather().set_index('date')['precipitation']['2015'])
        len(rainfall_mm)
Out[1]: 365

この配列は、2015年1月1日から12月31日までの日次降水量をインチ(2.54センチ)単位で表した365個の要素を持ちます。

手始めにMatplotlib(このツールについては ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也
プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

Matt LeMay, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 高橋 一貴

Publisher Resources

ISBN: 9784814400638Publisher Website