第 7 章. 数据共享合作
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
数据共享是加快数字化转型的业务需要。
数据共享是指为内部和外部利益相关者提供访问 的能力,以获取他们在自己的数据系统中无法访问的信息。数据共享允许利益相关者访问在生产者领域中生产或收集和存储的数据,并就共同的业务目标和优先事项开展合作。数据组织正在从通常会导致数据平台缓慢移动的单一大型部门,转变为创建模块化快速移动数据产品的小型分布式团队。这种现代数据社区是一种组织和文化转变,从单体数据组织转变为解耦的、敏捷的小型团队。
通过建立一个强大的数据共享架构,数据和分析领导者将能够在正确的时间访问正确的数据,从而提供有意义的业务成果。美国国立卫生研究院(NIH)等机构已经实施了数据管理和共享政策,规定数据共享是研究过程的基本组成部分,以最大限度地提高公众对研究成果的访问。
数据共享鼓励利用我们当下所掌握的信息和资源,无论它们存在于何处,并根据这些信息采取行动。公司越早开始共享数据并利用数据为决策提供依据,就越有时间取得业务成果。
数据是新的石油"(data is the new oil)一词最初由英国数学家和数据科学企业家克莱夫-汉比(Clive Humby)提出, ,在过去二十年里,事实证明了这一说法的正确性。数据推动业务决策,为研究提供信息,并为技术提供动力。企业收集和存储的数据比以往任何时候都多。但是,随着数据的丰富,如何有效地共享和协作这些数据也成为了一个挑战。
在本章中,您将学习如何使用 Amazon Redshift 共享和协作处理大量数据。 首先,我们将介绍"Amazon Redshift 数据共享概述",并描述不同的"数据共享使用案例"。 接下来,我们将深入探讨 Amazon Redshift的 "数据共享关键概念",并介绍"如何使用数据共享"。 我们将探讨"使用跨账户数据共享实现跨账户数据共享 "的选项,并展示在"具有多租户存储模式的分析即服务用例 "中使用 Amazon Redshift 数据共享的不同选项。 接下来,我们将介绍如何启用"与 AWS ADX 集成的外部数据共享",以实现数据货币化,并让客户使用其 Amazon Redshift 计算即时访问数据。 我们还将简要介绍如何将"从数据湖查询并卸载到数据湖 "作为数据共享机制。 最后,我们将介绍如何通过使用"Amazon DataZone 来发现和共享数据 "来编目和管理对数据共享的访问。
亚马逊 Redshift 数据共享概述
Amazon Redshift 数据共享可实现 跨数据仓库的即时、细粒度和实时数据访问,而无需复制或移动数据。这使您能够创建多仓库架构,并针对各种类型的工作负载扩展每个数据仓库。Amazon Redshift 数据共享包含在无服务器或 RA3 配置的数据仓库中,并提供以下功能:
-
对所有消费者的数据进行实时和交易一致的查看
-
在组织内部和组织之间开展安全、规范的协作
-
与外部共享数据,将您的数据货币化
数据的实时访问和事务一致性视图可确保用户始终看到数据仓库中更新的最新、最一致的信息。您可以安全地与同一账户中的 Amazon Redshift 数据仓库或同一区域内或跨区域的不同 AWS 账户共享数据。在构建用于分析的可扩展架构时,您需要考虑查询和摄取工作负载的性能、弹性和性能价格,以满足动态工作负载的要求。Amazon Redshift 数据共享功能提供了另一种机制来扩展和满足各类工作负载的需求。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access