Skip to Content
企业数据目录
book

企业数据目录

by Ole Olesen-Bagneux
May 2025
Beginner to intermediate
218 pages
2h 29m
Chinese
O'Reilly Media, Inc.
Content preview from 企业数据目录

第 1 章. 数据目录简介

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

在本章中,你将了解数据目录的工作原理、使用对象和原因。首先,我们将介绍数据目录的核心功能,以及它如何创建企业 IT 全景概览、如何组织数据以及如何让数据搜索变得简单。作为数据目录的一部分,搜索往往没有得到充分利用,价值也被低估,这对数据目录是一个巨大的损害。因此,我们将把数据目录作为一个搜索引擎来讨论,它将释放成功的潜能。

在本章中,你还将了解到数据目录在企业中的好处:数据目录可以提高数据的可发现性,从而确保数据治理并加强数据驱动的创新。此外,你还将了解如何组建数据发现团队,并了解谁是数据目录的用户。在本章的最后,我将解释数据目录中的角色和职责。

好了,我们走吧。

数据目录的核心功能

数据目录的核心是对公司数据进行有组织的清点。就是这样。

数据目录只提供元数据级别的概览,因此不会暴露实际数据值。这就是数据目录的最大优势:你可以让每个人都看到所有内容,而不用担心机密或敏感数据外泄。图 1-1 是数据目录的高级描述。

图 1-1. 数据目录的高层视图

数据目录基本上是一个包含元数据的数据库,这些元数据是从特定公司 IT 环境中的数据源推送或提取的。数据目录内部还有一个搜索引擎,可以搜索从数据源收集到的元数据。数据目录几乎总是具有更多的功能,但图 1-1展示了必要的核心组件。在本书中,我认为搜索功能是数据目录最重要的功能。

在本节中,我们将讨论数据目录的三个主要功能,即创建 IT 环境中的数据概览、组织数据以及允许搜索数据。让我们简要了解一下数据目录是如何做到这一点的。

备注

有了数据目录,整个组织都能看到自己拥有的数据。如果使用得当,这种透明度会非常有用。例如,数据科学家将不再花费一半的时间来搜索数据,他们将能更好地了解真正有价值的数据。想象一下这种可能性。他们可以利用新发现的时间来分析数据,发现可以引导企业开发出更好产品的见解!

创建 IT 全景概览

创建 IT 全景概览涉及查找和显示其中的所有数据源,并列出与之相关的人员或角色。

数据目录可以通过扫描 IT 环境的内置爬虫获取元数据。另外,它还可以通过让数据系统向目录报告元数据来获取推送的元数据。我们将在第 2章和第 6 章详细讨论推送和拉取。

数据目录中反映的 IT 环境将作为 "标签"(在数据目录中创建并组织到术语表中的术语)添加到业务 中。我们将在第 2 章讨论词汇表术语,并在第 3 章讨论如何使用它们进行搜索。除了术语表,您还可以使用元数据来增强数据目录资产,包括附加说明、分类等。

此外,数据目录内置了各种角色和权限,如数据管理员、数据所有者(数据目录有不同的角色类型名称)和其他角色,这些角色都在数据目录中执行特定的任务。我将在本章结尾为大家介绍这些角色。

一旦您提取/推送了您的 IT 环境,并为其分配了选定的术语、其他元数据和角色,就可以在目录中进行搜索。

没有员工能看到 IT 环境中的所有数据。更令人困惑的是:没有员工能看到其他人能看到的数据。基本上,没有人知道 IT 环境中的所有数据:这是不透明的。1这种情况也被称为 数据孤岛

备注

当几组员工在各自的系统中处理自己的数据时,就会出现数据孤岛,这些数据与组织其他部门的数据相互隔离,互不知晓。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

机器学习流水线实战

机器学习流水线实战

Hannes Hapke, Catherine Nelson
大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Python机器学习基础教程

Python机器学习基础教程

Andreas C. Müller, Sarah Guido

Publisher Resources

ISBN: 9798341658172