9章プロットと可視化
的確な情報を与えてくれる、有益な可視化(プロットとも言います)をすることは、データ分析において最も重要な作業の1つです。可視化はデータ探索プロセスの一部であり、可視化を行うことで、例えば異常値やデータ変形の必要性が認識しやすくなることもあれば、可視化がモデルのアイデアを作り上げるための1つの手段として使えることもあります。他方で、ウェブ用の対話的な可視化システムの構築が最終目標という場合もあるかもしれません*1。Pythonには、静的な可視化や動的な可視化を行えるアドオンライブラリがたくさんありますが、ここでは主にMatplotlib(https://matplotlib.org)やその上に構築されたライブラリを取り上げます。
*1 訳注:探索的なプロセスの一部として行われる可視化(探索的ビジュアライゼーション)の他に、分析結果から得られた知見を人に説明するための可視化(説明的ビジュアライゼーション)も存在します。可視化システムの構築は、探索的ビジュアライゼーションの提供が目的の場合もあれば、説明的ビジュアライゼーションの提供が目的の場合もあるでしょう。探索的ビジュアライゼーションと説明的ビジュアライゼーションについては、『デザイニング・データビジュアライゼーション』(オライリー・ジャパン、2012年6月)で詳しく扱っています。また、主に説明的ビジュアライゼーションを作成する上での設計の指針が、『データビジュアライゼーションの基礎』(オライリー・ジャパン、2022年3月)で詳説されています。
Matplotlibは、出版に適したプロットや図版を作成するための、デスクトッププロットパッケージです。プロジェクトは、MATLABに似たプロットインタフェースをPythonで実現するのを目的として、2002年にJohn ...
Get Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.