10!
Работа с неразмеченными данными:
кластерный анализ
В предыдущих главах мы использовали методы обучения с учителем для построения
моделей машинного обучения, опираясь на готовые ответы, — метки классов уже были
доступны в обучающих данных. В этой главе мы переключимся на данные без меток и
исследуем кластерный анализ — категорию методов обучения без учителя, которые
позволяют нам обнаруживать скрытые структуры в данных, где мы заранее не знаем
правильный ответ. Цель кластеризации — найти естественное разбиение данных на
группы, чтобы элементы в одном кластере были больше похожи друг на друга, чем на
элементы из других кластеров.
Кластеризация — захватывающая исследовательская тема. В этой главе вы узнаете ...