Capítulo 6. Transformación de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el patrón ELT definido en el Capítulo 3, una vez que los datos se han ingestado en un lago de datos o almacén de datos(Capítulo 4), el siguiente paso en una canalización es la transformación de datos. La transformación de datos puede incluir tanto la manipulación no contextual de los datos como su modelado teniendo en cuenta el contexto y la lógica empresarial.

Si el objetivo de la canalización es producir información o análisis empresarial, además de las transformaciones no contextuales, los datos se transforman en modelos de datos. Recuerda del Capítulo 2 que un modelo de datos estructura y define los datos en un formato comprensible y optimizado para el análisis de datos. Un modelo de datos se representa como una o varias tablas en un almacén de datos.

Aunque los ingenieros de datos a veces construyen transformaciones no contextuales en una canalización, se ha convertido en algo típico que los analistas de datos y los ingenieros analíticos se encarguen de la gran mayoría de las transformaciones de datos. Las personas que desempeñan estas funciones están más capacitadas que nunca gracias a la aparición del patrón ELT (¡tienen los datos que necesitan justo en el almacén!) y de herramientas y marcos de apoyo diseñados con SQL como lenguaje principal.

Este capítulo explora tanto las transformaciones no contextuales que son comunes ...

Get Referencia de bolsillo sobre canalizaciones de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.