第2章. 表計算スキルを強化する
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データ・ビジュアライゼーションのデザインを始める前に、スプレッドシートのスキルがスピードアップしていることを確認することが重要だ。このトピックを教えているとき、公式な学校や職場のトレーニングの一環として、表計算ツールの使い方を「本当に学んだことがない」と説明する人を多く耳にした。しかし、スプレッドシートのスキルは、面倒な作業の時間を驚くほど短縮するだけでなく、より重要なこととして、データの中に埋もれているストーリーを発見するのに役立つため、習得が不可欠である。
本書で後述するインタラクティブなチャートやマッピングは、 データテーブルの上に構築されている。このテーブルは通常、Google Sheets、LibreOffice、Microsoft Excelなどのスプレッドシートツールで開く。スプレッドシートは通常、図2-1に示すように、数値またはテキストデータの列と行を含む。最初の行にはヘッダ、つまり各列のデータを説明するラベルが含まれていることが多い。また、列には文字が、行には数字が自動的に付 けられ、グリッド内のすべてのセルやボックスがC2 のように参照できるようになっている。セルをクリックすると、自動的に他のセルを参照する計算式が表示されることがある。演算子は常に等号で始まり、他のセルを単純に足し合わせることもあれば(=C2+C3+C4 のような)、特定の演算子を実行する関数を含むこともある(セル範囲の平均の計算など:=average(C2:C7) )。表計算ファイルには複数のシート(ワークブックと呼ばれることもある)が含まれているものがあり、下部の各タブで特定のシートを開くことができる。
図2-1. ヘッダ、タブ、アクティブセルに数式が表示されている。
この章では、まず「Google Sheetsを共有する」、「 Google Sheetsにアップロードして変換する」、 「Google Sheetsで住所をジオコーディングする」、「Googleフォームでデータを収集する」といった基本的な手順を確認する。次に、「データのソートとフィルタリング」、「 数式を使った計算」、「ピボットテーブルを使ったデータの要約」など、データを整理して分析する方法について説明する。最後に、「VLOOKUPで列を一致させる」、「スプレッドシートとリレーショナルデータベースの比較」など、異なるシートをつなげる方法を検討する。これらのメソッドはすべて初級ユーザーを念頭に置いて解説しているので、予備知識は必要ない。
本書では、これらのスキルのいくつかを、サンプルデータを使って練習する。これまでに、本書の3,000人以上の読者が、一般化された場所、これまでの経験や教育のレベル、データ可視化を学ぶ目的などについて、簡単な公開アンケートに答えてくれた。もしまだ回答していないのであれば、アンケートに答えて自分のレスポンスに貢献し、またどのように質問が投げかけられたかをよりよく理解し、その結果を公開サンプルデータセットで見てみよう。
コンピュータに面倒なデータ準備作業をさせる方法を学びたいのであれば、この章は間違いなくあなたのためにある。あるいは、すでにスプレッドシートに慣れ親しんでいると感じているのなら、少なくともこの章はざっと目を通すべきだろう。おそらく、この本の後半でより効率的にチャートやマップを作成するのに役立つトリックを1つか2つ学ぶことができるだろう。 ...