Capítulo 1. A pilha de governança moderna
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os dados são o novo petróleo.
Clive Humby
Neste capítulo, começaremos com uma introdução à governança de dados e por que ela é importante. Se você já está familiarizado com a governança de dados em geral e está convencido de que ela é realmente importante no espaço de análise, pode pular para "O amanhecer da Lakehouse". Se você já está familiarizado com o paradigma da Lakehouse e com a plataforma Databricks, pule direto para "Databricks Unity Catalog: Habilitando a governança unificada".
Apresentando a governança de dados
Em 28 de outubro de 2021, uma equipe de segurança cibernética do da SafetyDetectives descobriu um bucket não seguro do Amazon S3 que continha mais de um milhão de arquivos. Entre outras coisas, o conteúdo do bucket incluía informações de identificação pessoal (PII) de funcionários e dados confidenciais da empresa de alguns aeroportos na Colômbia e no Peru. Embora o conteúdo dos buckets datasse de novembro de 2018, ninguém sabia há quanto tempo os buckets haviam sido expostos publicamente. Aparentemente, o bucket S3 pertencia a uma empresa de serviços de segurança bem estabelecida e proeminente chamada Securitas, com sede em Estocolmo, Suécia, e filiais em todo o mundo.
Esse não foi um incidente isolado. Em julho de 2019, a Capital One sofreu uma violação de dados em que mais de 100 milhões de registros ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access