
1.6
この本の案内
13
ています。これらは、この本の残りの部分の前提知識となっています。
Python
言語の経験が既にある
場合は、これらの章はさっと読んだり飛ばしてもかまいません。
その次では、
NumPy
の主要な機能を簡潔に紹介しています。
NumPy
の高度な内容については付録
A
にまとめています。その後は
pandas
を紹介し、それ以降の部分では
pandas
と
NumPy
、(可視化のた
めの)
Matplotlib
を使ってデータ分析を行う話題に移ります。なるべく順番通りに読めるように構成し
ましたが、一部細かい点において章を行き来する必要があります。そういった部分では、まだ紹介し
ていない概念が使われることがあります。
読者の方々にとって、各自が思う最終的な目標はそれぞれ異なると思いますが、そこで必要となるタ
スクは、概ね次のようなグループに分かれるでしょう。
世界に触れる
たくさんのファイル形式やデータストアを読み書きする。
準備する
データのクリーニング、変換、結合、正規化、再形成、スライシング、ダイシング、変形な
どを行う。
変形する
データセットに対して数学的、統計的な操作を行って、新しいデータセットを導出する(例え
ば、大きなテーブルをグループ変数で集約する、など)。
モデル化と計算を行う
データを統計モデルや機械学習のアルゴリズム、その他の計算のためのツールと結び付ける。
プレゼンテーションを行う
対話的なグラフや静的なグラフ、あるいは、文字による要約表現で可視化する。
1.6.1
コード例
この本の大半のコー