Overview
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
As empresas do mundo inteiro ingerem um total de 2,5 quintilhões de bytes de dados todos os dias. Mas quanto dessa vasta quantidade de dados - usada para criar produtos, alimentar sistemas de IA e tomar decisões de negócios - é de baixa qualidade ou simplesmente ruim? Este livro prático mostra-te como garantir que os dados em que a tua organização se baseia contêm apenas registos de alta qualidade.
A maioria dos engenheiros de dados, analistas de dados e cientistas de dados preocupa-se genuinamente com a qualidade dos dados, mas muitas vezes não têm tempo, recursos ou compreensão para criar uma solução de monitorização da qualidade dos dados que seja bem-sucedida em escala. Neste livro, Jeremy Stanley e Paige Schwartz, da Anomalo, explicam como pode utilizar a monitorização automatizada da qualidade dos dados para cobrir todas as suas tabelas de forma eficiente, alertando proactivamente para todas as categorias de problemas e resolvendo-os imediatamente.
Este livro irá ajudar-te:
- Aprende porque é que a qualidade dos dados é um imperativo empresarial
- Compreender e avaliar modelos de aprendizagem não supervisionada para detetar problemas nos dados
- Implementa notificações que reduzem o cansaço dos alertas e permitem fazer a triagem e resolver problemas rapidamente
- Integra a monitorização automatizada da qualidade dos dados com catálogos de dados, camadas de orquestração e sistemas de BI e ML
- Compreende os limites da monitorização automatizada da qualidade dos dados e como os ultrapassar
- Aprende a implantar e gerenciar sua solução de monitoramento em escala
- Mantém a monitorização automatizada da qualidade dos dados a longo prazo