
Работа с неразмеченными данными: кластерный анализ
329
>>> plt.legend()
>>> plt.tight_layout()
>>> plt.show()
Алгоритм DBSCAN успешно распознал группы точек в форме полумесяцев (рис. 10.16),
что подчеркивает одну из сильных сторон DBSCAN — кластеризацию данных произ-
вольной формы.
Рис. 10.16. Кластеризация данных в форме полумесяцев с помощью алгоритма DBSCAN
Однако следует отметить и некоторые недостатки DBSCAN. С увеличением количества
признаков в нашем наборе данных — при фиксированном количестве обучающих при-
меров — усиливается негативное влияние проклятия размерности. Это особенно про-
блематично, если мы используем евклидову ...