
478
5
章 機械学習
ポートします。
In[1]: %matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
5.12.1
GMM
の必要性:
k
平均法の弱点
k
平均法の弱点を見た上で、クラスタモデルをどのように改善できるかを考えてみましょう。前
の節で見たように、単純でわかりやすいデータがあれば、
k
平均法は適切なクラスタリング結果を
見つけられます。
例えば、単純な集団を形成しているデータがある場合、
k
平均法アルゴリズムは見た目で行うの
と同じような方法で、クラスタに素早くラベルを付けることができます(図 5-124)。
In[2]: # Generate some data
データの生成
from sklearn.datasets.
samples_generator import make_blobs
X, y_true = make_blobs(n_samples=400, centers=4,
cluster_std=0.60, random_state=0)
X = X[:, ::-1] # flip axes for better plotting
In[3]: # Plot the data with k-means labels k
平均法でラベルを推定して表示する
from sklearn.cluster import KMeans ...