Capítulo 15. Vecinos más próximos K
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
15.0 Introducción
El clasificador k-próximos vecinos (KNN) es uno de los clasificadores más sencillos pero más utilizados en el aprendizaje automático supervisado. KNN se considera a menudo un aprendiz perezoso; técnicamente no entrena un modelo para hacer predicciones. En su lugar, se predice que una observación es de la misma clase que la de la mayor proporción de las k observaciones más cercanas.
Por ejemplo, si una observación de clase desconocida está rodeada por una observación de clase 1, entonces la observación se clasifica como clase 1. En este capítulo exploraremos cómo utilizar scikit-learn para crear y utilizar un clasificador KNN.
15.1 Encontrar los vecinos más próximos de una observación
Problema
Necesitas encontrar las k observaciones más cercanas (vecinas) de una observación de .
Solución
Utiliza NearestNeighbors de scikit-learn:
# Load librariesfromsklearnimportdatasetsfromsklearn.neighborsimportNearestNeighborsfromsklearn.preprocessingimportStandardScaler# Load datairis=datasets.load_iris()features=iris.data# Create standardizerstandardizer=StandardScaler()# Standardize featuresfeatures_standardized=standardizer.fit_transform(features)# Two nearest neighborsnearest_neighbors=NearestNeighbors(n_neighbors=2).fit(features_standardized)# Create an observationnew_observation ...