
Работа с неразмеченными данными: кластерный анализ
309
Признак 1
Кластер 1
Кластер 2
Кластер 3
Центроиды
Рис. 10.2. Кластеры, найденные алгоритмом k-средних, и их центроиды
10.1.2. Более разумный способ размещения
начальных центроидов: алгоритм k-средних++
До сих пор мы обсуждали классический алгоритм k-средних, который использует слу-
чайное начальное число для размещения начальных центроидов, что иногда может
приводить к плохой кластеризации или медленной сходимости, если начальные цен-
троиды выбраны неудачно. Один из способов решения этой проблемы — запустить
алгоритм k-средних несколько раз на одном и том же наборе данных