数据治理:权威指南
by Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, Jessi Ashdown
序言
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
近年来,迁移到云计算的便捷性激励并激发了快速增长的数据消费者群体收集、捕获、存储和分析数据,以获得洞察力和决策制定能力。由于种种原因,随着云计算的采用率不断提高,信息管理相关人员对在云中管理数据可能涉及的风险产生了疑问。埃夫伦在医疗保健行业工作时第一次遇到了这样的问题,他必须建立管理数据的流程和技术。现在在谷歌云公司,尤里和拉克也几乎每周都要回答这些问题,并就从数据中获取价值、打破数据孤岛、保护匿名性、保护敏感信息以及提高数据可信度等问题给出建议。
我们注意到,正是GDPR促使客户的行为发生了巨大变化。一些客户甚至删除了他们的数据,认为这样做是正确的。这种反应比其他任何反应都更促使我们撰写这本书,其中收录了我们多年来为 Google Cloud 客户提供的建议。如果数据是新货币,我们不希望企业害怕数据。如果数据被锁起来或不可信,那么它就没有价值。
我们都以帮助 Google Cloud 客户的技术支出获得价值而自豪。数据是一项巨大的投资,我们认为有责任为客户提供最佳方式,让他们从中获得价值。
客户的问题通常涉及三个风险因素之一:
- 确保数据安全
- 在公共云基础设施中存储数据可能会让那些通常在企业内部部署系统并期待严密安全性的大型企业感到担忧。随着大量安全威胁和漏洞新闻的出现,企业担心自己可能成为下一个受害者。这些因素导致了风险管理方面的担忧,即如何防止敏感数据(从个人身份信息 (PII) 到企业机密信息、商业秘密或知识产权)遭到未经授权的访问或暴露。
- 法规与合规
- 包括《加州消费者隐私法案》(CCPA)、《欧盟通用数据保护条例》(GDPR)以及特定行业标准(如金融行业的全球法律实体标识符(LEI)编号和保险行业的 ACORD 数据标准)在内的一系列法规正在不断增加。负责遵守这些法规和标准的合规团队可能会对云中存储数据的监督和控制感到担忧。
- 可见性和控制
- 数据管理专业人员和数据消费者有时对自己的数据状况缺乏可见性:哪些数据资产可用、这些资产位于何处、如何以及是否可以使用、谁可以访问数据以及他们是否应该访问数据。这种不确定性限制了他们进一步利用自身数据提高工作效率或推动业务价值的能力。
这些风险因素清楚地凸显了加强数据评估、元数据编目、访问控制管理、数据质量和信息安全等核心数据治理能力的必要性,云提供商不仅要提供这些能力,还要以透明的方式不断提升这些能力。从本质上讲,在不放弃云计算提供的优势的前提下应对这些风险,不仅提升了了解云计算中数据治理的重要性,而且也让我们知道了什么是重要的。良好的数据管理可以激发客户的信任,并极大地改善客户体验。
企业为何需要云数据管理
随着企业生成更多数据并将其转移到 Cloud 中,数据管理的动态会发生一些根本性的变化。企业应注意以下几点:
- 风险管理
- 人们担心敏感信息可能会暴露给未经授权的个人或系统、安全漏洞或已知人员在错误的情况下访问数据。各组织都希望将这种风险降到最低,因此需要额外的保护方式(如加密)来混淆数据对象的嵌入信息,以便在系统漏洞发生时保护数据安全。此外,还需要其他工具来支持访问管理、识别敏感数据资产,并制定相关的保护政策。
- 数据激增
- 企业创建、更新和流式传输数据资产的速度不断加快,虽然基于云的平台能够处理不断提高的数据速度、数量和种类,但必须引入控制和机制,以快速验证高带宽数据流的质量方面。
- 数据管理
- 需要采用外部生成的数据源和数据流(包括来自第三方的付费馈送),这意味着您应准备好不信任所有外部数据源。您可能需要引入记录数据来源、分类和元数据的工具,以帮助您的员工(尤其是数据消费者)根据他们对数据资产产生过程的了解来确定数据的可用性。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access