Capítulo 4. Catálogos de dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
O nível de armazenamento na arquitetura lakehouse é importante, uma vez que armazena os dados de toda a plataforma. Para pesquisar, explorar e descobrir esses dados armazenados, os usuários precisam de um catálogo de dados. Este capítulo se concentrará em entender um catálogo de dados e o processo geral de gerenciamento de metadados que permite que os usuários da plataforma lakehouse pesquisem e acessem os dados.
Na primeira secção deste capítulo, explicarei conceitos fundamentais como metadados, metastore e catálogos de dados. Esses conceitos não são novos; há muito tempo as organizações vêm implementando catálogos de dados em data warehouses tradicionais e plataformas de dados modernas. Explicarei esses conceitos básicos primeiro para preparar nossa discussão sobre os recursos avançados mais adiante neste capítulo.
Discutiremos a forma como os catálogos de dados diferem na arquitetura lakehouse, em comparação com as arquitecturas tradicional e combinada, e como ajudam os utilizadores a obter uma visão unificada de todos os metadados. Também discutiremos as vantagens adicionais dos catálogos de dados na arquitetura lakehouse, que permitem aos utilizadores aproveitar os metadados para implementar um mecanismo unificado de governação de dados, controlo de permissões, linhagem e partilha.
Na última seção deste capítulo, discutirei ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access