Chapitre 3. Principe des données en tant que produit
L'un des défis de longue date des architectures de données analytiques existantes est la friction et le coût élevés de l'utilisation des données : découvrir, comprendre, faire confiance, explorer et finalement consommer des données de qualité. De nombreuses enquêtes ont mis en évidence ces frictions. Un rapport récent d'Anaconda, une société de plateforme de science des données, "The State of Data Science 2020 ", constate que près de la moitié du temps d'un scientifique des données est consacré à la préparation des données - chargement et nettoyage des données. S'il n'est pas pris en compte, ce problème ne fait que s'aggraver avec le maillage des données, car le nombre de lieux et d'équipes qui fournissent des données, c'est-à-dire les domaines, augmente. La répartition de la propriété des données de l'organisation entre les mains des domaines d'activité soulève d'importantes préoccupations en matière d'accessibilité, de facilité d'utilisation et d'harmonisation. La poursuite du cloisonnement des données et la régression de la facilité d'utilisation des données sont des conséquences indésirables potentielles du premier principe du maillage des données, la propriété orientée vers les domaines. Le principe des données en tant que produit répond à ces préoccupations.
Le deuxième principe du maillage ...