Capítulo 5. Generación de datos en los sistemas fuente

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Bienvenido a la primera etapa del ciclo de vida de la ingeniería de datos: la generación de datos en los sistemas fuente. Como hemos descrito antes en, el trabajo de un ingeniero de datos consiste en tomar datos de los sistemas fuente, hacer algo con ellos y convertirlos en útiles para servir a casos de uso posteriores. Pero antes de obtener datos en bruto, debes comprender dónde existen los datos, cómo se generan y sus características y peculiaridades.

Este capítulo cubre algunos patrones populares de sistemas fuente operativos y los tipos significativos de sistemas fuente. Existen muchos sistemas fuente para la generación de datos, y no los cubriremos todos exhaustivamente. Consideraremos los datos que generan estos sistemas y las cosas que debes tener en cuenta al trabajar con sistemas fuente. También discutiremos cómo se aplican las corrientes subyacentes de la ingeniería de datos a esta primera fase del ciclo de vida de la ingeniería de datos(Figura 5-1).

Figura 5-1. Los sistemas fuente generan los datos para el resto del ciclo de vida de la ingeniería de datos

A medida que proliferan los datos, sobre todo con el aumento de los datos compartidos (que veremos a continuación), esperamos que el papel de un ...

Get Fundamentos de la Ingeniería de Datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.