Capítulo 2. Transformación de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Mientras que la ingesta de datos se limita a transferir datos del punto A al B, la transformación de datos convierte los datos brutos en información valiosa a través de diversas etapas del ciclo de vida de los datos. Este capítulo profundiza en los diversos lenguajes, plataformas y tecnologías de que disponen los profesionales de los datos para ejecutar transformaciones de datos.

Veremos cómo garantizar que las transformaciones de datos se realizan de forma eficiente y bien coordinada, sentando las bases para discusiones más detalladas sobre eficiencia, escalabilidad y observabilidad más adelante en la guía.

¿Qué es la transformación de datos?

La transformación de datos es el arte de manipular y mejorar los datos para que sirvan mejor a los usuarios y los procesos. La transformación implica tomar unos datos, ya sea en estado bruto o casi prístino, y realizar una o varias operaciones para acercarlos al uso previsto. En una canalización ETL, la transformación no se produce en uno, sino en muchos lugares. Los datos pueden transformarse en el momento de la ingesta y de nuevo en cualquier punto posterior. El objetivo de la transformación de datos es convertirlos en un activo, utilizando el análisis y la ciencia para crear algo de valor para la empresa.

La transformación puede ser tan sencilla como eliminar los registros no deseados, ...

Get Entender el ETL now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.