Capítulo 2. O Unity Catalog nos bastidores
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Em 2021, enquanto os arquitetos de dados da Nexa Boutique (Nexa) analisavam as estratégias de governança de dados para a empresa, a Databricks anunciou o Unity Catalog. Essa solução nativa de governança de dados para a plataforma Databricks forneceu uma alternativa mais capaz ao HMS. O Unity Catalog unifica a governança de todos os ativos da plataforma Databricks, incluindo tabelas, visualizações, modelos de ML e IA, tabelas vetoriais e arquivos nos volumes do Unity Catalog, além dos limites do espaço de trabalho.
As organizações geralmente trabalham com vários formatos de dados em seus patrimônios de dados, gerados por sistemas de origem diferentes, o que garante várias ferramentas de governança de dados - um desafio que a Nexa também enfrentou. O uso de várias ferramentas de governança de dados sob medida em seu patrimônio de dados leva a uma governança fragmentada, o que geralmente não é uma escolha deliberada. O Unity Catalog aborda a questão da governança fragmentada, fornecendo um produto unificado e coeso para governar seus dados e ativos de IA.
Este capítulo aborda a arquitetura essencial do Unity Catalog. Ele explora o que está por trás da estrutura e os recursos que o tornam um catálogo ideal para atender às suas necessidades de governança.
A história do Unity Catalog começa com a história da governança no ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access