Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
6.3 グラフの種類 163
6 -13 箱ひげ図は、分布の範囲と四分位数(つまり、中央値と分散)を簡潔に示す
データポイント自体を示すように努力してみよう。
や線種を使って線もしくはクラスを区別する:複数のクラスの f(x) 関数を重ね合わせて描いたグ
ラフが多い。例えば、男女別で学歴の関数として収入を描くような場合だ。
このような場合、個々のクラスを表す線もしくは点の色を変えるとよい。点線、破線、実線、太線と
いった線種を利用することもできるが、色よりも見分けにくく、モノクロ媒体に出力する場合以外は
色の方がよい。1 枚のグラフでそのような方法で見分けられるのは線が 2 本から 4 本くらいまでで、
それ以上になると、ごちゃごちゃした塊に見えてしまう。多くの要素を持つグループを可視化するに
は、グループを意味のあるクラスタに分割し、それぞれ本数が少なく、すっきりした折れ線グラフに
まとめていくとよい。
6.3.3 散布図
大規模なデータセットを効果的に見せるのは本当に難しいことだ。点が多すぎるとあっという間にグラフ
で表現できる限界を越えて、真っ黒な塊の画像になってしまう。しかし、散布図なら、適切に描けば数千も
2 変量点をクリアでわかりやすく見せることができる。
散布図は、与えられたデータセットのすべての (x, y) の値を示す。散布図は、4.1 節で身長体重空間の点
として個々人を表現してボディマス指数を可視化した際に既に使っている。個々の点の色は、正常、軽度肥
満、肥満の分類を反映したものだった。散布図のベストプラクティスをまとめておこう。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other