Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 20. Agrupación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Donde nosotros tales racimos teníamos

Como nos hizo noblemente salvajes, no locos

Robert Herrick

La mayoría de los algoritmos de este libro son lo que se conoce como algoritmos de aprendizaje supervisado, en el sentido de que empiezan con un conjunto de datos etiquetados y los utilizan como base para hacer predicciones sobre nuevos datos no etiquetados. La agrupación, sin embargo, es un ejemplo de aprendizaje no supervisado, en el que trabajamos con datos completamente sin etiquetar (o en el que nuestros datos tienen etiquetas pero las ignoramos).

La idea

Siempre que observes alguna fuente de datos, es probable que los datos formen de algún modo conglomerados. Un conjunto de datos que muestre dónde viven los millonarios probablemente tenga conglomerados en lugares como Beverly Hills y Manhattan. Un conjunto de datos que muestre cuántas horas trabaja la gente a la semana probablemente tenga un conglomerado en torno a las 40 (y si procede de un estado con leyes que obligan a conceder prestaciones especiales a las personas que trabajan al menos 20 horas a la semana, probablemente tenga otro conglomerado en torno a las 19). Un conjunto de datos demográficos de votantes registrados probablemente forme una variedad de conglomerados (por ejemplo, "madres futbolistas", "jubilados aburridos", "millennials en paro") que los encuestadores y los asesores ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625