第3章 魅力的なダッシュボードを作成する
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
第2章では、米国運輸統計局(BTS)から定時運航データを取り込み、航空便のさまざまな属性を考慮して到着遅延をモデル化できるようにした。分析の目的は、フライトが予定到着時刻から15分以内に到着する確率が70%未満の場合、会議をキャンセルすることである。
統計モデルや機械学習モデルを構築する前に、データセットを探索し、データを直感的に理解することが重要である。これは探索的データ分析と呼ばれ、第5章で詳しく説明する。意思決定の基礎として使われるデータセットに対しては、必ず探索的データ分析を行うべきである。しかし、この章では、エンドユーザや意思決定者が、あなたが行おうとしている推奨事項を理解できるように、データを描写することの別の側面について話す。この章で話すダッシュボードと呼ばれる視覚的表現の対象は、他のデータサイエンティストではなく、エンドユーザである。ダッシュボードの目的は既存のモデルを説明することであり、モデルを開発することではない。ダッシュボードは、対話式で、エンドユーザに合わせて作られ、新しいデータで継続的に更新されるエンドユーザレポートである。表3-1を参照のこと。
| 意思決定者向け | データサイエンティスト向け | |
|---|---|---|
| 使用パターン | ダッシュボード | 探索的データ分析 |
| 描写の種類 | 現在の状況、ゲージ、トレンドライン | エラーバー付きモデルフィット、カーネル密度推定値 |
| 何を説明するのか? | モデルの推奨度と信頼度 | 入力データ、特徴の重要性、モデルの性能など。 |
| 代表的なデータ | ユーザのコンテキストに合わせたデータセットのサブセット | 過去データの集計 |
| 代表的なツール | Data Studio、Tableau、Qlik、Looker、plotly、D3、shiny appsなど。 | Jupyter、Python、R Studio、S-plus、matplotlib、seaborn、Matlabなど。 |
| 相互作用のモード | GUI駆動 | コード・ドリブン |
| 更新 | リアルタイム | リアルタイムではない |
| でカバーされている。 | 第3章、第4章 | 第5章 |
| 例 |
2013年5月、AAA燃料計レポートより |
|
エンドユーザの視覚的な描写を作成するこのステップは、データを視覚化するように、「ビジュアライゼーション」という無機質な名前で呼ばれることが非常に多い。しかし、私は意図的にそのような名前でコールしないことにした。ダッシュボードは、データを描写し、モデルを説明するために設計された、非常に視覚的でインタラクティブなレポートである。このように使用することで、ダッシュボードはビジネスインテリジェンス(BI)を提供する。
この章のコード・スニペットはすべて、この本の GitHub リポジトリの ...