Overview
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os padrões tradicionais de arquitetura de dados são muito limitados. Para utilizar estes padrões, tem de ETL os dados para cada ferramenta - um processo de custo proibitivo para tornar as funcionalidades do armazém disponíveis para todos os seus dados. A falta de flexibilidade destes padrões obriga-o a ficar preso a um conjunto de ferramentas e formatos prioritários, o que cria silos de dados e desvios de dados. Este livro prático mostra-te uma forma melhor.
O Apache Iceberg fornece os recursos, o desempenho, a escalabilidade e a economia que cumprem a promessa de um lago de dados aberto. Seguindo as lições deste livro, poderás obter análises interactivas, em lote, de aprendizagem automática e de fluxo contínuo com este formato de código aberto de elevado desempenho. Os autores Tomer Shiran, Jason Hughes e Alex Merced, da Dremio, mostram-te como começar a utilizar o Iceberg.
Com este livro, aprenderás:
- A arquitetura das tabelas do Apache Iceberg
- O que acontece nos bastidores quando realizas operações em tabelas Iceberg
- Como otimizar ainda mais as tabelas Iceberg para obter o máximo desempenho
- Como utilizar o Iceberg com motores de dados populares, como o Apache Spark, o Apache Flink e o Dremio
Descobre porque é que o Apache Iceberg é uma tecnologia fundamental para a implementação de um lago de dados abertos.