Overview
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Prêt à simplifier le processus de construction de data lakehouses et de pipelines de données à grande échelle ? Dans ce guide pratique, découvrez comment Delta Lake aide les ingénieurs, les scientifiques et les analystes de données à surmonter les principaux défis en matière de fiabilité des données grâce à des techniques modernes d'ingénierie et de gestion des données.
Les auteurs Denny Lee, Tristen Wentling, Scott Haines et Prashanth Babu (avec la contribution de R. Tyler Croy, responsable de la maintenance de Delta Lake) partagent leurs connaissances d'experts sur tout ce qui concerne Delta Lake, notamment sur la manière d'exécuter simultanément des tâches par lots et en continu et d'accélérer l'utilisation de vos données. Vous découvrirez également comment les transactions ACID apportent de la fiabilité aux data lakehouses à grande échelle.
Ce livre t'aidera à :
- Comprendre les principaux défis en matière de fiabilité des données et comment Delta Lake les résout
- Expliquer le rôle essentiel des journaux de transactions Delta en tant que source unique de vérité
- Découvrir l'écosystème de Delta Lake avec des technologies telles qu'Apache Flink, Kafka et Trino
- Construis des data lakehouses avec l'architecture Medallion
- Optimise les performances de Delta Lake grâce à des fonctionnalités telles que les vecteurs de suppression et le clustering liquide
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access