Capítulo 5. Ingeniería de Datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 4, vimos cómo podemos utilizar las herramientas y mecanismos de Data Factory para cargar datos en Fabric; en este capítulo, nos centraremos en la experiencia de la Ingeniería de Datos.
La ingeniería de datos implica la creación de la infraestructura técnica necesaria para capturar, almacenar y procesar volúmenes importantes de datos. Este campo incluye el diseño de canalizaciones para extraer datos de múltiples fuentes, transformarlos para garantizar una alta calidad y uniformidad, y almacenarlos en bases de datos o soluciones de almacenamiento donde puedan analizarse. Los ingenieros de datos utilizan diversas tecnologías para mantener estos sistemas fiables, eficientes y escalables. Su trabajo garantiza que los datos estén disponibles y puedan utilizarse fácilmente, formando la columna vertebral del análisis de datos y apoyando las decisiones informadas y basadas en datos dentro de las empresas.
Un ejemplo real de ingeniería de datos en acción puede verse en una empresa de comercio electrónico que procesa millones de transacciones diarias. Utilizando Microsoft Fabric, los ingenieros de datos diseñan canalizaciones que extraen datos de ventas sin procesar de diversas fuentes, como registros web, bases de datos de clientes y procesadores de pagos de terceros. Los trabajos de Spark que se ejecutan en cuadernos limpian ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access