Capítulo 2. Curadoria dos teus dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os académicos definem a curadoria de dados como "o ato de descobrir uma ou mais fontes de dados de interesse, limpar e transformar os novos dados, integrá-los semanticamente com outras fontes de dados locais e deduplicar o composto resultante".1
Os CDOs pensam na curadoria de dados de forma mais ampla como o processo estratégico e sistemático de organização, gestão e manutenção de dados para garantir a qualidade, integridade e usabilidade dos dados em toda a empresa para atender às necessidades de uma variedade de casos de uso e aplicativos de negócios, desde relatórios básicos até ML e IA avançados.
Ambas as partes concordam que a curadoria de dados envolve a recolha, validação, transformação, armazenamento, preservação e divulgação de dados. No entanto, do ponto de vista prático do C-suite, a curadoria de dados tem de ir além da preparação de dados para aplicações individuais. Como as grandes quantidades de dados continuam a aumentar, a capacidade de automatizar o processo de curadoria de dados de forma eficaz e em escala tornou-se um fator cada vez mais crítico para apoiar iniciativas empresariais modernas, complexas e multifuncionais.
Este capítulo explora os métodos para automatizar e gerir a curadoria de dados. Vamos começar por ver o que é uma boa curadoria de dados em escala.
O valor da curadoria de dados
A curadoria ...