第3章. データを発見し、質問する
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
ビジュアライゼーション・プロジェクトの初期段階では、多くの場合、相互に関連する2つの問題からスタートする:信頼できるデータはどこで発見できるか?そして発見した後、そのデータは本当に何を表しているのか?この2つの問題について深く考えることなく、チャートやマッピングの作成に急ぎすぎると、意味のない、あるいはもっと悪いことに、誤解を招くようなビジュアライゼーションを作成してしまう危険性がある。
この章では、「検索のための質問」、 「公的データと私的データ」、 「機密データのマスクまたは集約」、 「オープンデータリポジトリ」、 「データのソース」、 「悪いデータの認識」において、これら2つの幅広い問題を分解する。最後に、いくつかのファイルを発見したら、"Question Your Data "でデータの限界に疑問を持ち、それを認める方法を提案する。
情報は魔法のように何もないところから現れるわけではない。それどころか、人々はその時代の社会的文脈や権力構造の中で、明示的あるいは暗黙的な目的をもって、 データを収集し、公表しているのである。データ可視化の提唱者として、私たちは情報に乏しい代替案よりも証拠に基づく推論を強く支持する。しかし、数字や他の形態のデータは中立ではないため、いわゆるデータの客観性を受け入れることに注意を払う。従って、データを扱う際には、誰の物語が語られているのか、誰の視点が語られずにいるのか、より深く問うために立ち止まる。データ・フェミニズムの著者であるキャサリン・ディグナツィオとローレン・クラインによれば、このような質問をすることによってのみ、私たちは「特権が私たちのデータ実務やデータ製品にどのように組み込まれているのかを知るようになる」。1
検索のための指針になる質問
多くの人にとって、データ検索とは単にウェブ上でいくつかのキーワードをGoogleで検索することだ。それがうまくいくこともあれば、うまくいかないこともある。そのようなアプローチがうまくいかないとき、私たちは優秀な図書館員、ジャーナリスト、研究者たちとともに働きながら、データ検索について学んだ多くの教訓を振り返る。その結果、データを検索する方法について、より思慮深いプロセスを概説する一連の指針となる質問を教えてくれた。
データで答えようとしている質問とは何か?
、あなた自身の考えを明確にし、また、あなたを助けてくれる他の人に明確に伝えることができるようにするためである。私たちの脳は、可能な結果の範囲を限定しないような形で質問を組み立てる最善の方法を考えることなく、答えを特定しようと自動的に飛躍してしまうことがあまりにも多い。
印象に残ったデータ可視化プロジェクトを振り返り、その動機となった根本的な疑問を特定する。ワシントン・ポスト紙とウェストバージニア州のチャールストン・ガゼット・メール紙は、米国のオピオイド蔓延に関する報道の中で、連邦政府と麻薬業界が秘密にしておこうとした米国麻薬取締局のデータベースを入手するための法廷闘争に成功した。2019年、データジャーナリストのチームは、彼らの中心的な疑問の1つに答えるため、データベースをインタラクティブなマッピングとともに公開した:米国の各郡に一人当たり何錠の処方オピオイドが送られ、どの企業や販売業者が責任を負っているのか?そのマッピングから、2006年から2014年まで毎年平均して住民一人当たり150錠以上のオピオイドを受け取っていたアパラチア地方のいくつかの郡に、高いクラスターがあることがわかった。さらに、この期間に全米で1000億錠のオキシコドンとヒドロコドンのうち、4分の3以上を流通させたのはわずか6社だった:マッケソン社、ウォルグリーン社、カーディナル・ヘルス社、アメリソース・バーゲン社、CVS社、ウォルマート社である。 ...