Capítulo 12. Vecinos más próximos k

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Si quieres molestar a tus vecinos, di la verdad sobre ellos.

Pietro Aretino

Imagina que intentas predecir cómo voy a votar en las próximas elecciones presidenciales. Si no sabes nada más sobre mí (y si tienes los datos), un enfoque sensato es fijarte en cómo piensan votar mis vecinos. Viviendo en Seattle, como vivo yo, mis vecinos invariablemente piensan votar al candidato demócrata, lo que sugiere que "candidato demócrata" también es una buena suposición para mí.

Ahora imagina que sabes de mí algo más que la geografía: tal vez conozcas mi edad, mis ingresos, cuántos hijos tengo, etcétera. En la medida en que mi comportamiento esté influido (o caracterizado) por esas cosas, mirar sólo a mis vecinos más próximos entre todas esas dimensiones parece probable que sea un predictor aún mejor que mirar a todos mis vecinos. Esta es la idea que subyace a la clasificación de vecinos más próximos.

El modelo

Vecinos más próximos es uno de los modelos de predicción más sencillos que existen. No hace ninguna suposición matemática, y no requiere ningún tipo de maquinaria pesada. Las únicas cosas que requiere son:

  • Alguna noción de distancia

  • La suposición de que los puntos cercanos entre sí son similares

La mayoría de las técnicas que veremos en este libro examinan el conjunto de datos en su totalidad para aprender patrones en los datos. ...

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.