
118 Глава 3
использованное нами в предыдущем коде, является просто обобщением евклидова и
манхэттенского расстояний, которое можно записать следующим образом:
.
Оно становится евклидовым расстоянием, если мы устанавливаем параметр
p=2
или
манхэттенским, если
p=1
. В scikit-learn доступны многие другие метрики расстояния —
их можно указать в параметре
metric
4
.
Наконец, важно отметить, что алгоритм kNN очень сильно подвержен переобучению
из-за проклятия размерности (curse of dimensionality). Проклятие размерности описы-
вает ситуацию, когда пространство признаков становится все более разреженным по
мере увеличения ...