Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
240
4
章 
Matplotlib
による可視化
図4-26 点プロパティを利用して、アイリスデータの特徴を表示する
この散布図は、
4
つの異なる次元のデータを同時に示していることがわかります。各点の
(
x
,
y
)
位置は、がく片の長さと幅に対応し、点のサイズは花びらの幅、色は花の種類に関連しています。
このような多色および多相散布図は、データの探索と理解の両方に役立ちます。
4.4.3
plot
メソッド対
scatter
メソッド:効率に関する注意点
plt.plot
plt.scatter
で利用できる機能は別にして、どちらを使用するべきか明快に示すこと
はできるでしょうか?
少量のデータではそれほど重要ではありませんが、データセットが数千ポ
イントを超えると、
plt.plot
plt.scatter
よりもずっと効率的です。
plt.scatter
には各点ごと
に異なるサイズや色を描画できるため、レンダラーは各点を個別に構築するための余分な作業を
行わなければなら
ないからです。一方、
plt.plot
では、すべての点は本質的にお互いのクローン
であるため、点の外観を決定する作業はデータセット全体に対して
1
度だけ行われます。大規模な
データセットの場合、これらの
2
つの違いによってパフォーマンスが大きく異なる可能性がありま
す。そのため、大きなデータセットに対しては
plt.scatter
よりも
plt.plot
を優先する必要があり
ます。
4.5
 誤差の可視化
あらゆる科学的な実験において、誤差の正確な評価は、測定値を正し
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other