book

Le catalogue de données de l'entreprise

Name: Le catalogue de données de l'entreprise
Author: Ole Olesen-Bagneux
ISBN: 9798341613997

by Ole Olesen-Bagneux

November 2024

Intermediate to advanced

218 pages

7h 4m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Avant-propos
Préface
Qui devrait lire ce livre ?Naviguer dans ce livreConventions utilisées dans ce livreApprentissage en ligne O'ReillyComment nous contacterRemerciements
I. Organiser les données pour pouvoir les rechercher
1. Introduction aux catalogues de données
Les fonctions essentielles d'un catalogue de donnéesCréer une vue d'ensemble du paysage informatiqueOrganiser les donnéesPermettre la recherche dans les données de l'entrepriseDécouverte de donnéesL'équipe de découverte des donnéesArchitectes de donnéesIngénieurs de donnéesMise en place de l'équipe de découverte des donnéesRôles et responsabilités de l'utilisateur finalRésumé
2. Organiser les données : Concevoir une architecture robuste pour la recherche
Organiser les domaines dans le catalogue de donnéesArchitecture de domaine dans un catalogue de donnéesComprendre les domainesProcessus et capacitésSources de donnéesIntégrer les actifs dans le catalogue de donnéesTirePousserOrganiser les biens dans les domainesMétadonnées des biensQualité des métadonnéesClassificationRésumé
3. Comprendre la recherche : Concepts, caractéristiques et mécanismes
Pourquoi chercher dans un catalogue de données ?Fonctions de recherche dans un catalogue de donnéesRecherche dans les données ou recherche de donnéesComment effectuer une recherche dans un catalogue de données ?Langage d'interrogation du catalogue de donnéesExplication des fonctions de recherche dans un catalogue de donnéesÀ la recherche de tout ?La mécanique de la rechercheRappel et précisionLoi de ZipfSérendipitéRésumé
4. Appliquer la recherche : Des modèles simples aux modèles avancés
Cherche comme les bibliothécaires - pas comme les scientifiques des données.Modèles de rechercheRecherche simple de baseRecherche simple et détailléeRecherche simple et flexibleRecherche de gammeRecherche de blocsRecherche d'énoncésModèles de navigationNavigation dans le glossaireNavigation dans les domainesNavigation dans la lignéeNavigation graphiqueRecherche dans un catalogue de données basé sur un graphiqueRésumé
II. Démocratiser les données avec un catalogue de données
5. Découvrir les données : Responsabiliser les utilisateurs finaux et impliquer les parties prenantes.
Un catalogue de données est un réseau social.Métadonnées activesAssurer l'engagement des parties prenantesEngager les leaders de la gouvernance des donnéesEngager les leaders de l'analyse des donnéesImpliquer les leaders du domaineVoir toutes les données à travers un seul objectifL'épine dorsale opérationnelle et la plateforme de donnéesRésumé
6. Accès aux données : Les clés d'une mise en œuvre réussie
Choisir un catalogue de donnéesAnalyse des fournisseursQuelques vendeurs clésCatalogue des cataloguesComment accéder aux donnéesFournisseurs et consommateurs de donnéesApproche centraliséeApproche décentraliséeApproche combinéeConstruire des domainesQuestionnaire n° 1 : Propriétaire du domaine Description du domaine et des biensQuestionnaire n°2 : Gestionnaire des biens Description des biens du domaineQuestionnaire n°3 : Description des termes du glossaire de leurs actifs par les gestionnaires des actifs.Résumé

7. Gérer les données : Améliorer la gestion du cycle de vie
La valeur de la gestion du cycle de vie des données et pourquoi le catalogue de données change la donneDifférents cycles de vieCycle de vie des donnéesUtilisation du catalogue de données pour la gestion du cycle de vie des donnéesLe cycle de vie des actifs de données dans le catalogue de donnéesGlossaire Terme Cycle de vieCycle de vie des sources de donnéesInfluence et soutien sur le cycle de vieRecherche appliquée basée sur les cycles de vieRecherche appliquée pour la conformité réglementaireMeilleures pratiques d'entretienMaintenance des données en dehors du catalogue de donnéesMaintenance des métadonnées dans le catalogue de donnéesAmélioration de la gestion du cycle de vie des donnéesRésumé
III. Envisager l'avenir des catalogues de données
8. Perspectives d'avenir : Le moteur de recherche de l'entreprise et l'amélioration de la gestion des données
Le moteur de recherche de l'entrepriseLe moteur de recherche de l'entreprise dans Hugin & MuninDes données à la connaissanceUn point de vue théorique moyen sur le moteur de recherche de l'entrepriseLe moteur de recherche de l'entreprise est-il nouveau ?Le moteur de recherche de l'entreprise deviendra-t-il réalité ?Résumé
Postface
Envisager la mise en place d'un catalogue de donnéesSuis-moi
Annexe. Langage d'interrogation du catalogue de données
Index
A propos de l'auteur

Content preview from Le catalogue de données de l'entreprise

Avant-propos

Lorsque j'ai commencé à me concentrer sur le catalogage des données au milieu des années 2010, le monde de l'analyse des données avait atteint un point d'inflexion. Les grands projets modernes d'infrastructure de données, centrés sur les lacs de données et généralement liés à des clusters Hadoop internes, avaient atteint un certain niveau de maturité. L'architecture technique était en place. Cependant, la promesse d'innovation et de création de valeur, qui avait été l'argument initial en faveur de dépenses massives dans les infrastructures des organisations, n'avait guère porté ses fruits au-delà de quelques cas d'utilisation menés par des équipes pionnières enthousiastes.

J'ai le sentiment que cet échec relatif trouve ses racines davantage dans la gouvernance de ces nouvelles infrastructures transversales que dans la technologie en tant que telle. Ces échecs se sont manifestés de deux manières opposées.

Dans certains cas, le manque de gouvernance a fait que les lacs de données se sont transformés en marécages de données - d'énormes espaces de stockage contenant des données dont le contenu et l'origine étaient inconnus de tous, et que personne ne savait comment utiliser.

Dans d'autres cas, le déploiement d'outils de gouvernance sophistiqués a enfermé les données dans des procédures complexes et bureaucratiques, inhibant ainsi l'agilité et l'expérimentation nécessaires au cœur de l'innovation.

En conséquence, les organisations ont commencé à migrer (ou à créer) leurs ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Special Edition Using MS-DOS® 6.22, Third Edition

Publisher Resources

ISBN: 9798341613997

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Le catalogue de données de l'entreprise

by Ole Olesen-Bagneux

Avant-propos

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.