Capítulo 14. Casos de uso de Apache Iceberg en el mundo real
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En este capítulo, nos sumergiremos en algunas de las aplicaciones de Apache Iceberg en el mundo real y te proporcionaremos experiencia práctica en la ejecución de diferentes casos de uso analítico soportados por una arquitectura lakehouse. Estos casos de uso incluirán garantizar la calidad de los datos en los lagos de datos, crear informes de inteligencia empresarial (BI) e implementar procesos críticos como CDC. En este repositorio complementario encontrarás casos de uso adicionales para construir una arquitectura analítica en tiempo real, ejecutar cargas de trabajo de aprendizaje automático (ML) y dimensiones que cambian lentamente (SCD). Este capítulo es una guía práctica introductoria, que muestra cómo abordar aplicaciones esenciales del mundo real utilizando Iceberg y destaca su adaptabilidad e importancia como elemento central de cualquier arquitectura de datos .
Garantizar datos de alta calidad con Write-Audit-Publish en Apache Iceberg
Mantener el máximo nivel de calidad de los datos es crucial para obtener perspectivas significativas. Si la calidad de los datos se ve comprometida en cualquier punto de un flujo de trabajo de ingeniería de datos, puede afectar negativamente a los análisis posteriores, como el BI y el análisis predictivo. Por ejemplo, considera un proceso de extracción, transformación ...