Skip to Content
Automatizar la supervisión de la calidad de los datos
book

Automatizar la supervisión de la calidad de los datos

by Jeremy Stanley, Paige Schwartz
September 2024
Intermediate to advanced
220 pages
6h 54m
Spanish
O'Reilly Media, Inc.
Content preview from Automatizar la supervisión de la calidad de los datos

Capítulo 5. Construir un modelo que funcione con datos reales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 4, compartimos un algoritmo para el monitoreo de la calidad de los datos con aprendizaje automático no supervisado. Una cosa es leer sobre estos pasos, y otra muy distinta construir un modelo que funcione bien en la práctica en cualquier conjunto de datos arbitrario del mundo real. Si no tienes estrategias para tener en cuenta matices como la estacionalidad, las características temporales y las correlaciones entre columnas, tu modelo alertará en exceso o en defecto, a menudo de forma drástica.

Además de conocer los escollos a los que debes prestar atención, tendrás que evaluar continuamente tu modelo comparándolo con datos de referencia para averiguar dónde y cómo mejorar. Compartiremos métodos para la comprobación eficaz de modelos, incluyendo ideas sobre el desarrollo de una biblioteca para introducir el caos en datos perfectamente bien manejados (cue evil laugh).

Retos y mitigación de los datos

Para que tu modelo sea realmente valioso y no ruidoso, necesitarás estrategias para superar los retos que presentan los datos en la naturaleza.

Estacionalidad

Los humanos somos criaturas muy estacionales. Cambiamos nuestros patrones de comportamiento según la hora del día y el día de la semana. Pagamos las facturas más o menos el mismo día cada mes y nos vamos de vacaciones más o menos en la ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Fundamentos de la Observabilidad de los Datos

Fundamentos de la Observabilidad de los Datos

Andy Petrella
Fundamentos de la calidad de datos

Fundamentos de la calidad de datos

Barr Moses, Lior Gavish, Molly Vorwerck

Publisher Resources

ISBN: 9781098196936Supplemental Content