第 6 章 获取数据 访问数据:成功实施的关键
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
本章不是关于实际实施数据目录的章节,而是关于在实施数据目录之前必须做出的最重要决定的章节。
我将向您介绍在选择数据目录时应考虑哪些因素,您可以通过哪些方式来创建对数据目录中数据的访问,最后,域所有者和资产管理者在描述其域及其资产时必须向自己提出的问题。
首先,让我们来看看数据目录的选择标准。
选择数据目录
大多数 数据目录都擅长我在下文中列出的一种或多种不同功能,例如数据来源或共享协议、如何组织数据,或者如何适应特定的技术堆栈。尽管有很多数据目录在某些方面做得很好,但没有哪个数据目录能完美地完成所有工作(比如同样虚构的 Hugin & Munin 公司使用的虚构数据目录)。此外,与其他数据目录相比,你可能更喜欢某个数据目录做某些事情的方式。关键是要知道你需要从数据目录中得到什么。
供应商分析
要想知道哪种数据目录适合你的组织,第一步就是要确定你对数据目录的需求。你可能需要一个擅长一种或多种功能的数据目录,因此下面的概述可以帮助你进行供应商分析。
提示
请阅读第 8 章。在这一章中,你可以找到关于数据编录将如何发展的建议。这可能会影响你现在的选择,因为在选择数据目录时也可以考虑一些未来趋势。
一般来说,本书是从与技术无关的企业架构角度来编写的,因为在使用数据目录时,这将在最长的时间内为你提供最大的帮助。在选择数据目录时,你要首先考虑企业架构指定的功能,因为它们比执行它的技术更持久:
-
数据来源
-
数据共享
-
房舍内
-
定制建造
-
单一云提供商
-
一个平台
-
数据智能
-
数据管理
-
知识图谱驱动的数据目录
-
数据可观察性
-
目录中的目录
备注
在解释您需要考虑的每项功能之前,请记住,该列表是针对特定技术的。这样做的目的是为您提供更多有关 2022-23 年数据目录供应商格局的背景信息。虽然列表中讨论的功能在很长一段时间内仍将适用,但提及的供应商可能会更改名称、重点或性能。与 IT 领域的任何功能一样,功能是稳定的,但具体技术会不断变化和发展。请查看供应商网站,了解最新信息。
一些主要供应商
数据 脉络 是许多数据目录的标准功能,但某些供应商专门为大型、多样化的 IT 环境提供深度、非常复杂的数据脉络。数据脉络是自动记录公司数据处理方式的重要组成部分,可在企业范围内进行搜索,以了解资产之间的上下游依赖关系。
作为手工制作的 Visio 图表和 PowerPoint 幻灯片的替代品,数据脉络是一张始终保持最新且准确的数据实际移动地图--它以经验为基础,而 Visio 图表等从创建之初就始终存在不确定性因素,新鲜度也会下降,这与数据脉络相反,数据脉络会持续更新。如第 5 章所述,在数据线性领域,Octopai和MANTA等公司是重要的参与者。
数据共享是一项新兴功能,它不仅仅是数据目录中一个简单的 "请求 "按钮。可以对数据合同和共享数据的质量进行衡量,以表明数据提供者提供的数据在多大程度上符合数据消费者的需求。在这一领域,Great Expectations正在成为先行者。
对于许多成功运行和使用 前云时代开发的关键业务系统和应用程序的公司,或者需要 企业内部数据中心的公司(如制造流程)来说,企业内部 是一个繁重、复杂的重点。某些数据目录将处理内部部署的复杂性作为专门的重点,尤其是 Informatica(它也能在云中执行!)。
定制构建也是一种选择--你可以构建自己的数据目录。但是,由于该领域的供应商众多,遵循 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access