Capítulo 2. Gerenciando dados com o Delta Lake
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os data lakehouses utilizam estruturas de armazenamento especializadas para aprimorar a funcionalidade dos data lakes tradicionais. Entre essas estruturas, o Delta Lake se destaca como uma tecnologia líder que alimenta a plataforma Databricks Lakehouse. Neste capítulo, exploraremos os conceitos fundamentais do Delta Lake, primeiro introduzindo seus princípios básicos e depois mergulhando em seu uso prático. Em seguida, vamos nos concentrar em tópicos avançados do Delta Lake, como viagem no tempo, otimização de tabelas e operações de vácuo.
Apresentamos-te o Delta Lake
Os lagos de dados tradicionais sofrem frequentemente de ineficiências e deparam-se com vários desafios no processamento de grandes volumes de dados. A tecnologia Delta Lake é uma solução inovadora concebida para funcionar em cima de lagos de dados para ultrapassar estes problemas. Para compreenderes claramente o que é o Delta Lake, vamos primeiro estudar a sua definição, tal como fornecida pelos seus criadores originais na Databricks.
O que é o Delta Lake?
Delta Lake é uma camada de armazenamento de código aberto que traz fiabilidade aos lagos de dados, adicionando uma camada de armazenamento transacional sobre os dados armazenados no armazenamento Cloud.
Databricks
No contexto dos data lakehouses, uma camada de armazenamento refere-se à estrutura ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access