Prefácio de Rick Sears
Os dados tornaram-se uma parte central da criação de aplicações de software modernas e do crescimento de organizações modernas orientadas para os dados. Engenheiros de dados, administradores de dados, analistas de dados e cientistas de dados estão entre os indivíduos nessas organizações que desejam fazer mais uso de seus dados. Muitos destes profissionais de dados optam por criar as suas aplicações orientadas para os dados na Amazon Web Services (AWS), optando frequentemente por armazenar os seus dados num lago de dados baseado no Amazon Simple Storage Service (S3).
Estes clientes podem querer alterar e manipular os seus dados ao longo do tempo, continuando a utilizar os dados enquanto estes estão a mudar e, por isso, constroem as suas aplicações com suporte para tecnologias de data lake transaccionais. O Apache Iceberg é uma tecnologia-chave utilizada pelos clientes da AWS que constroem lagos de dados transaccionais porque é rápida, eficiente e fiável em escala, ao mesmo tempo que oferece integrações simples com estruturas populares de processamento de dados em execução na AWS, como o Apache Spark, o Apache Flink, o Apache Hive, o Presto, o Trino, o Dremio, entre outros, bem como suportada pelos serviços da AWS, como o Amazon EMR, o Amazon Redshift, o Amazon Athena, o AWS Glue, entre outros.
Apache Iceberg: O Guia Definitivo concentra-se em aplicações práticas e cenários úteis para profissionais de dados que utilizam o Apache Iceberg e tem exercícios práticos ...