
152 6 章 データの可視化
6.2.2 嘘係数の最小化
可視化は、データが言おうとしていることを正しく伝えることを追求すべきだ。最も大胆な嘘は、データ
そのものを歪めることだが、データを正確に報告しつつ、データが言いたいことをあえて誤解するように導
くこともできる。タフテは、グラフの嘘係数を次のように定義している。
嘘係数 =
グラフが与える印象の大きさ
データが与える印象の大きさ
嘘のないグラフを作るためには、誤解を導くような技法を避け、嘘係数を最小化しなければならない。次
のような行為は問題があるので、避けるべきである。
• 分散
を示さずに平均だけを示す:平均が同じでも、{100, 100, 100, 100, 100} と {200, 0, 100, 200, 0}
では、ストーリーが異なる。平均とともに実際の点をプロットすることができない場合には、少なく
とも分散を示し、平均が分布をどの程度反映しているかを明らかにすべきだ。
• 実際のデータを示さずにデータを補間した結果を示す:回帰線やフィット曲線は、トレンドを伝え、
大規模なデータセットを単純化するために効果がある。しかし、もとになったデータポイントを示さ
なければ、どの程度適合しているのかを確かめられない。
• スケーリングの歪み:グラフのアスペクト比によって、解釈に大きな影響が出る。図 6 -6 は、アスペ
クト比以外が同じである財務時系列データを表す 3 つのグラフである。
下のグラフは、この時系列データは安定している印象を与える。心配はなさそうだ。しかし、右上の ...