Skip to Content
企业数据目录
book

企业数据目录

by Ole Olesen-Bagneux
May 2025
Beginner to intermediate
218 pages
2h 29m
Chinese
O'Reilly Media, Inc.
Content preview from 企业数据目录

第 3 章. 了解搜索:概念、功能和机制

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

您现在知道如何在数据目录中组织数据:创建域、将数据源拉入或推入域并添加元数据。现在,您已经准备好搜索数据目录了。

但为什么要搜索数据目录?在数据目录中到底要搜索什么?如何进行实际搜索?简单搜索的效果如何?如何浏览数据?如何搜索复杂的主题?这些都是本章要讨论的问题。

在本章中,我们将讨论为什么要搜索数据目录、搜索什么以及如何搜索。我们还将介绍搜索的机制,以加深你对数据目录功能的理解。

首先,我们来讨论一下为什么

为什么要在数据目录中搜索?

为什么要搜索数据目录?简而言之,其实就是 "为了 数据发现"。

如果你问一名普通员工:"你为什么要搜索数据目录?"他们可能会说:"因为我需要信息来解决问题。如果你问治理最终用户,他们可能会说:"因为我们需要知道我们拥有哪些信息,以确保我们符合法律规定。如果你问数据分析最终用户,他们可能会说:"因为我们需要数据来分析趋势和进行改进。

这三个答案都是正确的,而且都与数据发现有关。如果你想知道你的组织中有哪些数据,数据目录就是搜索的地方。数据发现就从这里开始。

第 1 章中,我们讨论了数据目录中的三类最终用户:

  • 日常最终用户

  • 治理最终用户

  • 数据分析终端用户

每个最终用户都应将数据目录作为搜索流程的出发点。让我们逐一介绍终端用户。

日常最终用户是公司的所有员工,包括你自己。将最终用户视为一个群体,他们与公司的所有员工一样具有多样性。在 Hugin & Munin,日常最终用户包括建筑师、工程师、销售代表、各种技工等等。

最终用户在寻找各种各样的东西--例如,一份文件、一个标准操作程序或有关我们自己业务领域的分析见解。日常工作中,终端用户都会产生信息需求。用户通常会以快速、简单的方式进行搜索,只需键入一两个单词,希望能找到正确的搜索结果。

随着数据编目逐渐发展成为公司搜索引擎,日常最终用户也将出现,但在大多数数据编 目中,他们还不是一个广泛的用户群体。你将在第 8 章中看到更多的日常用户应用场景,以及他们未来将如何发展。

治理最终用户 是指负责公司数据治理计划的人员。例如,这包括合规经理和 DPO 或 CISO 的员工。对于这些类型的最终用户,数据目录提供了真正的数据发现:一种自动化的、功能强大的替代方案,可以取代这些员工在此之前经常手动更新的数据列表。数据目录将为数据治理终端用户提供一个全新的、最新的组织内实际数据概览。有了数据目录提供的这一概览,数据治理终端用户就可以改进对个人身份数据和机密数据的管理,并努力提高数据质量,加快关键情况下的数据检索速度

数据分析最终用户对数据发现非常熟悉;他们是数据科学家或数据工程师。对他们来说,数据发现意味着非常特殊的东西。他们习惯于在大型数据集中搜索能提供分析见解的模式。但他们往往会遇到一个大问题:什么是进行分析的最佳数据?通常,这些员工使用的不是最好的数据,而是他们所知道的数据。数据目录可以帮助解决这个问题,它为这些最终用户提供了一种搜索最佳数据以进行分析的方法。对这类最终用户来说,数据目录就像一根魔法棒:它是所有可进行分析的数据的结构化概览。它使为后续分析而选择的数据更加合适,成功的可能性更高。事实上,这种类型的最终用户正是数据目录在当今许多组织中变得如此重要的原因。

还有第四类终端用户。不过,这种终端用户既可以在上述三类用户中找到,也可以作为一个单独的类型:它就是数据工程师。数据工程师将数据从数据提供者转移到数据消费者,在这个过程中,了解数据源非常重要。这可以通过数据 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

机器学习流水线实战

机器学习流水线实战

Hannes Hapke, Catherine Nelson
大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Python机器学习基础教程

Python机器学习基础教程

Andreas C. Müller, Sarah Guido

Publisher Resources

ISBN: 9798341658172