Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
496
5
章 機械学習
各ポイントの位置にガウス分布を配置することで平滑化したこのプロットは、データ分布の形状
をより正確に表し、ばらつき(すなわち、サンプリングにより生じる差異)がはるかに小さくなり
ます。
最後の
2
つのプロットは、
1
次元でのカーネル密度推定の例です。
1
つ目はいわゆる「
tophat
」カー
ネルを使用し、
2
番目は、ガウスカーネルを使用しています。それでは、カーネル密度の推定につ
いて詳しく説明しましょう。
5.13.2
 カーネル密度推定の実践
カーネル密度推定のパラメータには、各点に配置される分布の形状、各点におけるカーネルのサ
イズを制御するバンド幅などの情報を指定できます。カーネル密度推定に使用できるカーネルは
多数存在します。
scikit-learn
KDE
実装では、
6
つのカーネルを用意しています。詳しくは
scikit-
learn
の密度推定(
Density Estimation
)ドキュメント(
http://s
cikit-learn.org/stable/modules/density.
html
)を参照してください。
Python
で使えるカーネル密度推定にはさまざまな(
SciPy
StatsModels
などのパッケージ)実
装が存在していますが、筆者は効率と柔軟性の面から
scikit-learn
を好んで使用します。これは
sklearn.neighbors.KernelDensity
推定器で実装されています。これは、
6
つのカーネルのいずれ
かと、多数の距離メトリックのうちの
1
つを使
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other