Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los ingenieros de datos expertos en Databricks tienen actualmente una gran demanda. A medida que las organizaciones recopilan más datos que nunca, los ingenieros de datos cualificados en plataformas como Databricks se vuelven fundamentales para el éxito empresarial. La certificación Databricks Data Engineer Associate es la prueba de que tienes un conocimiento completo de la plataforma Databricks y sus capacidades, así como las habilidades esenciales para ejecutar eficazmente diversas tareas de ingeniería de datos en la plataforma. En esta completa guía de estudio, construirás una base sólida en todos los temas que se tratan en el examen de certificación, incluyendo Databricks Lakehouse y sus herramientas y beneficios. También aprenderás a desarrollar canalizaciones ETL tanto en batch como en streaming.
En esta completa guía de estudio, construirás una base sólida en todos los temas que se tratan en el examen de certificación, incluyendo Databricks Lakehouse y sus herramientas y beneficios. También aprenderás a desarrollar pipelines ETL tanto en modo batch como en streaming. Además, descubrirás cómo orquestar flujos de trabajo de datos y diseñar cuadros de mando manteniendo la gobernanza de los datos. Por último, te sumergirás en los puntos más delicados de lo que se trata exactamente el examen y aprenderás a prepararte para él con exámenes de prueba.
El autor Derar Alhussein no solo te enseña los conceptos fundamentales, sino que también te ofrece ejercicios prácticos para reforzar tu comprensión. Desde la configuración de tu espacio de trabajo de Databricks hasta la implementación de pipelines de producción, cada capítulo está cuidadosamente elaborado para equiparte con las habilidades necesarias para dominar la plataforma Databricks. Al final de este libro, sabrás todo lo que necesitas para aprobar con éxito el examen de certificación de Databricks Data Engineer Associate y comenzar tu carrera como ingeniero de datos certificado por Databricks.
Aprenderás a:
- Utilizar la plataforma Databricks y Delta Lake de manera eficaz.
- Realizar tareas ETL avanzadas utilizando Apache Spark SQL
- Diseñar una arquitectura de múltiples saltos para procesar datos de forma incremental.
- Construye pipelines de producción utilizando Delta Live Tables y Databricks Jobs.
- Implementar la gobernanza de datos utilizando Databricks SQL y Unity Catalog.
Derar Alhussein es ingeniero de datos sénior y tiene un máster en minería de datos. Cuenta con más de una década de experiencia práctica en proyectos de software y datos, incluidos proyectos a gran escala en Databricks. Actualmente cuenta con ocho certificaciones de Databricks, lo que demuestra su competencia en el campo. Derar también es un instructor experimentado, con un historial demostrado de éxito en la formación de miles de ingenieros de datos, ayudándoles a desarrollar sus habilidades y obtener certificaciones profesionales.