第5章 データ分析 データ分析
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データを十分に拷問すれば、(何でも)自白するだろう。
ロナルド・コース
次の3章からなるブロックでは、データアナリストの中核的な活動である分析に焦点を当て、組織内での分析の目標とインパクトのある分析の方法に焦点を当てる。
データの分析、メトリックの設計、洞察の獲得、そしてそれらの洞察、アイデア、提言を意思決定者に提示する、あるいは売り込むといった活動について考察する。第6章ではメトリックと主要業績評価指標(KPI)の設計を取り上げ、第7章ではデータの視覚化とストーリーテリングに焦点を当てる。しかし、この3人の最初の章は、分析そのものに焦点を当てている。
重要なのは、分析や統計的推論の方法については、より優れたテキストがたくさんあるため、本書では扱わないということである(「Further Reading」を参照)。その代わりに、分析者の目標について考察する。分析者にとって分析するとはどういうことか?何を達成しようとしているのか?分析者はどのような道具を持っているのか?ここでは、第1章で出てきた分析のレベルという考え方を復活させ、分析のタイプに関する他の視点をいくつか紹介する。
ここでの目的は、分析者がデータから洞察を得るために利用できる、さまざまな統計ツールや可視化ツールを紹介することである。第二の目標は、アナリストに適切なツールを使用するよう促すことであり、必要であれば、目の前の問題をより深く理解することができる、より洗練されたツールを学ぶことである。
木のテーブルを作る優れた木工職人には、マホガニー材のような良質の原材料、ノミや正方形を作る道具、そしてそれらの道具をいつ、どのように使い、応用するかを知る技術が必要だ。この3つのうち1つでも欠ければ、最終製品の品質は大きく低下する。そして、分析も同様である。最大の価値を生み出す分析成果物を得るためには、原材料である高品質なデータと、さまざまな分析テクニックなどのツール、そしてそれらの分析ツールをいつ、どのように問題に適用するかを知るスキルが必要なのである。
分析とは何か?
"分析 "という言葉について少し考えてみる価値はあるだろう。これはギリシャ語に由来し、緩める、解きほぐすという意味である(Āνά [aná, "on, up"] + λύω [lúō, "I loosen"] から)。これは理にかなっているが、あまりにレベルが高すぎて、本当の意味を把握するのには役立たない。よりビジネス的な観点から、第1章の定義を思い出してほしい:
データ資産を競争力のある洞察に変換し、人、プロセス、テクノロジーを駆使してビジネスの意思決定と行動を促す。
マリオ・ファリア
、もう少し掘り下げて解剖してみよう。第2章と第3章で、「データ資産」についてある程度理解できたと思うが、インサイトとは何だろうか?
ウィキペディアによれば
洞察とは、特定の文脈における特定の原因と結果を理解することである。この言葉にはいくつかの関連した意味がある:
- 情報の一部
- 物事の本質を理解する、あるいは直観的に見る行為や結果(ギリシャ語ではノエシスと呼ばれる)
- 内観
- 鋭い観察力と推理力、洞察力、識別力、知覚力。
- モデル、文脈、シナリオ内の関係や振る舞いを特定することに基づく、原因と結果の理解。
原因と結果を理解すること、物事の本質を理解すること、モデルなどだ。それは助けになる。 ...