Capítulo 10. Pioneirismo no futuro dos sistemas de dados fiáveis
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Se os Fundamentos da qualidade dos dados te ensinaram alguma coisa sobre o estado mais vasto da análise e da engenharia de dados, é provável que os dados, enquanto indústria, estejam a passar por uma mudança maciça e irreversível.
Há apenas cinco anos, não era invulgar os dados viverem em silos, acedidos apenas por equipas funcionais numa base ad hoc para tarefas discretas, tais como compreender como os sistemas internos estavam a ser utilizados, por exemplo, ou talvez consultar dados sobre a utilização de aplicações ao longo do tempo. Atualmente, os dados analíticos estão a transformar-se na forma de moeda mais crítica e competitiva da empresa moderna. Já não é uma questão de saber se a tua empresa depende de dados, mas sim quanto e para que casos de utilização.
Ainda assim, não é suficiente recolher mais dados; também tens de confiar neles. Soluções como data warehouses e lagos de dados Cloud, catálogos de dados, estruturas de teste de código aberto e soluções de observabilidade de dados estão a desenvolver caraterísticas e funcionalidades adicionais para trazer a fiabilidade dos dados para o centro da conversa. Armazéns como o Snowflake e o Redshift facilitam a obtenção de métricas de qualidade de dados para atualização e volume, enquanto ferramentas de código aberto como dbt e Great Expectations ...