Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.12
 詳細:ガウス混合モデル
485
図5-131 GMM共分散タイプの可視化
5.12.3
GMM
による密度推定
GMM
はしばしばクラスタリングアルゴリズムに分類されますが、基本的には密度推定アルゴリ
ズムです。つまりデータに対する
GMM
適合の結果は、技術的にはクラスタリングモデルではなく、
データの分布を記述する生成的確率モデルです。
例として、
scikit-learn
make_moons
関数( 5-132 で可視化します)から生成されたデータで考
えてみましょう。これについては、「5.11 詳細:k 平均法クラスタリング」で一度使用しました。
In[13]: from sklearn.datasets import make_moons
Xmoon, ymoon = make_moons(200, noise=.05, random_state=0)
plt.scatter(Xmoon[:, 0], Xmoo
n[:, 1]);
図5-132 GMMに使用する非線形境界を有するクラスタ
このデータに対して、
2
成分のクラスタリングモデルとして
GMM
に適合させても、特に有用な
結果は得られません。
In[14]: gmm2 = GaussianMixture(n_components=2, covariance_type='full', random_state=0)
plot_gmm(gmm2, Xmoon)
486
5
章 機械学習
図5-133 非線形クラスタに適合させた2 成分のGMM
しかし、非常に多くの成分を使用してクラスタのラベルで色分けを行わなければ、入力データに ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other