第14章. 嘘を見抜き、バイアスを減らす
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データ・ビジュアライゼーションの目的は、情報を画像にエンコーディングし、真実と洞察に満ちたストーリーを捉えることだ。しかし、我々はビジュアライゼーションで嘘をつく人々に注意するよう警告してきた。はじめに」の所得不平等の例を振り返ってみると、図I-1とI-2のチャートや図I-3とI-4のマッピングを意図的に操作することで、同じデータをどのように並べ替えれば、まったく異なる現実の絵を描くことができるかを示している。だからといって、すべてのデータ視覚化が同じように有効なのだろうか?そうではない。よく調べてみると、米国の所得格差に関する2つのグラフのうち、2番目のグラフは真実を隠すために意図的に不適切なスケールを使っているため、誤解を招くと断言した。また、2つの世界地図は、米国が他方より濃い色(不平等のレベルが高いことを示す)で表示されていたとしても、等しく真実であることを打ち明けた。
2つの異なるビジュアライゼーションが同じように正しいわけがない。私たちのレスポンスは、自分たちの仕事をデータサイエンスと呼びたがる人々と対立するかもしれない。データサイエンスは、唯一の正解を持つ客観的世界を示唆するラベルである。そうではなく、、データビジュアライゼーションは、エビデンスに依存しつつも、現実の描写が1つだけではない、インタプリタ的なスキルとして理解するのがベストだと主張する。ご記憶の通り、我々の分野では、データをどのようにビジュアライズしてはいけないかについて、「チャートデザインの原則」と「マッピングデザインの原則」で紹介したいくつかの定義規則しかない。二項対立の世界ではなく、我々は、ビジュアライゼーションは3つのカテゴリーに分類されると主張している。
ビジュアライゼーションが間違っているのは、それが証拠を誤って表現しているか、、これらの厳格な設計規則のいずれかに違反している場合である。後者の例として、棒グラフや列グラフがゼロ以外の数字から始まる場合、誤った型である。なぜなら、これらの型は長さや高さによって値を表すため、基準線が切り捨てられた場合、読者は判断できないからである。同様に、円グラフのスライスの合計が100%以上になると、読者はそのグラフを正確に解釈できないので誤りであり、データの表示も正しくない。
、技術的にはデザイン規則に従っているが、不当に関連するデータの外観を隠したり、ねじ曲げたりしている場合、視覚化は誤解を招く。理不尽とは主観的なものであることは認めるが、不適切な縮尺の使用や縦横比のゆがみなど、この章ではいくつかの例を検討する。間違いと 真実の間にこのカテゴリーを入れることで、チャートや地図がいかにデータを正確に表示し、デザイン規則を遵守していながら、真実からわれわれを誤らせることができるかがアンダースコアとなる。
正確なデータを示し、デザイン規則に従っていれば、ビジュアライゼーションは真実である。しかし、このカテゴリの中にも品質の幅がある。同じように有効な2つのビジュアライゼーションを見たとき、片方がもう片方より優れていると言うことがある。それは、我々がまだ認識していなかった意味のあるデータパターンを照らしているからである。あるいは、一方が他方よりもこれらのパターンをより美しく、あるいはページ上のインクをより少なくして、よりシンプルに描写しているから優れていると言うかもしれない。いずれにせよ、私たちは真実味のあるビジュアライゼーションを目指し、クオリティの高い方を好むということに同意しよう。 ...