Skip to Main Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate content levelBeginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
144 6 データの可視化
力を過小評価していたということらしい。
言いたいのは、多くのものは見かけよりも複雑であることだ。特に、データの意味をつかむためにデータ
をグラフにするのは難しい。私がプレゼンテーションで見せられてきたグラフのかなりの部分はひどいもの
だった。何も伝わってこないか、データが実際に示していることをきちんと伝えていなかった。まずいグラ
フは、見せた相手を間違った方向に導くという点で、グラフがないよりもかえって悪い。
この章では、標準的なグラフを意味のあるものにするための原則を説明するとともに、グラフを適切に使
わなければどのような誤解を招くかを示す。ここでは、グラフが嘘をつくことがあるという感覚を養い、ど
うすればより良いグラフを作れるかを学んでほしい。
6.1 探索的データ分析
大規模なデータセットの登場により、サイエンスの手法が変わりつつある。従来の方法は、仮説駆動型
あった。研究者は、世界がどう動くかについての理論を構築し、データに基づいてこの仮説を裏付けるか否
定し
ていた。それに対し、最近のデータ駆動型のサイエンスは、まず大規模なデータセットを構築してか
ら、パターンを探す。うまくいけば、そのパターンが将来の分析において仮説の役割を果たす。
探索的データ分析は、与えられたデータセットからパターンやトレンドを探す。可視化技法は、この探索
の中で重要な役割を果たす。データを慎重かつていねいに見ることは、データ収集やデータ処理の誤りを見
つける、統計学的な前提条件に対する違反を見つける、面白い仮説を提案するといった理由からとても大切 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

オブザーバビリティ・エンジニアリング

オブザーバビリティ・エンジニアリング

Charity Majors, Liz Fong-Jones, George Miranda, 大谷 和紀, 山口 能迪
Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
PythonによるWebスクレイピング 第2版

PythonによるWebスクレイピング 第2版

Ryan Mitchell, 黒川 利明, 嶋田 健志

Publisher Resources

ISBN: 9784873118918Other