Capítulo 5. Arquitetar para a fiabilidade dos dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
A Airbnb, o mercado global de férias online, escreveu num post de 2020 no seu blogue de engenharia que "a liderança [estabeleceu] grandes expectativas para a atualidade e qualidade dos dados", levando à necessidade de fazer um investimento significativo nos seus esforços de qualidade e governação de dados. Entretanto, Krishna Puttaswamy e Suresh Srinivas, antigos engenheiros da Uber, escreveram num artigo de 2021 no blogue de engenharia da Uber que os grandes volumes de dados de alta qualidade estão "no centro desta plataforma de transformação maciça".
Não é segredo: a qualidade dos dados é a principal preocupação de algumas das melhores equipas de dados. No entanto, uma coisa é escrever sobre o assunto: como é que o conseguimos na prática?
A fiabilidade dos dados - a capacidade de uma organização para fornecer uma elevada disponibilidade e integridade dos dados ao longo de todo o ciclo de vida dos dados - é o resultado de uma elevada qualidade dos dados. À medida que as empresas recebem mais dados operacionais e de terceiros do que nunca, com funcionários de toda a organização a interagir com esses dados em todas as fases do seu ciclo de vida, torna-se cada vez mais importante que esses dados sejam fiáveis.
A fiabilidade dos dados tem de ser intencionalmente integrada em todos os níveis da sua organização, ...