Capítulo 1. Introdução ao Apache Iceberg
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os dados são um ativo primário a partir do qual as organizações recolhem as informações e os conhecimentos necessários para tomar decisões comerciais críticas. Quer sejam utilizados para analisar tendências nas vendas anuais de um determinado produto ou para prever futuras oportunidades de mercado, os dados moldam a direção que as organizações devem seguir para serem bem sucedidas. Além disso, hoje em dia, os dados não são apenas uma coisa agradável de se ter. É um requisito, não só para vencer no mercado, mas também para competir nele. Com uma procura tão grande de informação, tem havido um enorme esforço para acumular os dados gerados pelos vários sistemas dentro de uma organização para obter informações.
Ao mesmo tempo, o ritmo a que os sistemas operacionais e analíticos têm vindo a gerar dados disparou. Embora mais dados tenham dado às empresas a oportunidade de tomar decisões mais bem informadas, há também uma necessidade urgente de ter uma plataforma que armazene e analise todos esses dados para que possam ser usados para criar produtos analíticos, como relatórios de business intelligence (BI) e modelos de machine learning (ML) para apoiar a tomada de decisões. A arquitetura Lakehouse, que será abordada neste capítulo, separa a forma como armazenamos os nossos dados da forma como os processamos, para uma maior flexibilidade. ...