
144 6 章 データの可視化
力を過小評価していたということらしい。
言いたいのは、多くのものは見かけよりも複雑であることだ。特に、データの意味をつかむためにデータ
をグラフにするのは難しい。私がプレゼンテーションで見せられてきたグラフのかなりの部分はひどいもの
だった。何も伝わってこないか、データが実際に示していることをきちんと伝えていなかった。まずいグラ
フは、見せた相手を間違った方向に導くという点で、グラフがないよりもかえって悪い。
この章では、標準的なグラフを意味のあるものにするための原則を説明するとともに、グラフを適切に使
わなければどのような誤解を招くかを示す。ここでは、グラフが嘘をつくことがあるという感覚を養い、ど
うすればより良いグラフを作れるかを学んでほしい。
6.1 探索的データ分析
大規模なデータセットの登場により、サイエンスの手法が変わりつつある。従来の方法は、仮説駆動型で
あった。研究者は、世界がどう動くかについての理論を構築し、データに基づいてこの仮説を裏付けるか否
定し
ていた。それに対し、最近のデータ駆動型のサイエンスは、まず大規模なデータセットを構築してか
ら、パターンを探す。うまくいけば、そのパターンが将来の分析において仮説の役割を果たす。
探索的データ分析は、与えられたデータセットからパターンやトレンドを探す。可視化技法は、この探索
の中で重要な役割を果たす。データを慎重かつていねいに見ることは、データ収集やデータ処理の誤りを見
つける、統計学的な前提条件に対する違反を見つける、面白い仮説を提案するといった理由からとても大切 ...