
314 Глава 10
сколько точка отличается от других кластеров, а a
(i)
говорит нам, насколько она похожа
на другие точки в своем собственном кластере.
Силуэтный коэффициент доступен нам как
silhouette_samples
из модуля
metric
scikit-
learn, и дополнительно для удобства можно импортировать функцию
silhouette_scores
.
Функция
silhouette_scores
вычисляет средний силуэтный коэффициент по всем точкам,
что эквивалентно операции
numpy.mean(silhouette_samples(...))
. Выполнив следующий
код, мы создадим график силуэтных коэффициентов для кластеризации k-средних
с количеством кластеров k = 3:
>>> km = KMeans(n_clusters=3,
... init='k-means++', ...