Capítulo 7. Aprendizaje no supervisado
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
El término aprendizaje no supervisado se refiere a métodos estadísticos que extraen el significado de los datos sin entrenar un modelo en datos etiquetados (datos en los que se conoce un resultado de interés). En los Capítulos 4 a 6, el objetivo es construir un modelo (conjunto de reglas) para predecir una variable de respuesta a partir de un conjunto de variables predictoras. Esto es aprendizaje supervisado. En cambio, el aprendizaje no supervisado también construye un modelo de los datos, pero no distingue entre una variable de respuesta y las variables predictoras.
El aprendizaje no supervisado puede utilizarse para lograr diferentes objetivos.En algunos casos, puede utilizarse para crear una regla predictiva en ausencia de una respuesta etiquetada.Los métodosde agrupación pueden utilizarse para identificar grupos significativos de datos. Por ejemplo, utilizando los clics en la web y los datos demográficos de un usuario en un sitio web, podríamos agrupar diferentes tipos de usuarios. El sitio web podría entonces personalizarse para estos diferentes tipos.
En otros casos, el objetivo puede ser reducir la dimensión de los datos a un conjunto de variables más manejable.Este conjunto reducido podría utilizarse entonces como entrada en un modelo predictivo, como la regresión o la clasificación. Por ejemplo, podemos tener miles ...
Get Estadística Práctica para Científicos de Datos, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.