16章データの可視化
これまでの章で、生データを洗練されたDataFrameに変換するために必要なツールをすべて説明した。しかし、そのようなDataFrameから洞察を得るにはどうすればよいのだろうか?
1つの方法はデータの可視化だ。Pythonにはそのためのパッケージが数多く用意されている。低レベルのプロット用のMatplotlib、素早い可視化のためのhvPlot、インタラクティブなグラフのためのBokeh、Pythonのグラフィックスの文法を活用するplotnine、Polarsの組み込みプロット機能を使うためのAltairなどがある。図16-1にPythonの複雑なデータ可視化パッケージのランドスケープを概観する。
選択肢が多いのは良いことだが悪いことでもある。用件に合致したパッケージが存在する可能性は高いが、適切なパッケージを選ぶのは難しいからだ。さらに、それぞれのパッケージにはそれぞれの機能、前提条件、落とし穴がある。
データ可視化は、単にきれいな絵を描くことではなく、データサイエンスの基本でもある。DataFrameを画像に変換することで、傾向を理解し、異常値を発見し、意思決定に影響を与えるストーリーを語ることができる。効果的なデータ可視化は、不明瞭なものを明確にし、複雑なものを単純化することで、データをより利用しやすくする。
図16-1 Pythonのデータ可視化の概観(Jake VanderPlasのオリジナルから許可を得て改変)
|
免責事項 データ可視化は広範かつ多面的な分野であるが、本書では1章だけを割き、Polarsを使用する際に必要なエッセンスを紹介する。利用できる可視化パッケージの種類が非常に多いが、わかりやすく実用的な内容にするために、少数のパッケージに焦点を当てた。すべてのパッケージを網羅的に紹介することはできないし、比較もしない。 ... |
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access