Skip to Content
数据治理:权威指南
book

数据治理:权威指南

by Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, Jessi Ashdown
May 2025
Beginner to intermediate
254 pages
2h 39m
Chinese
O'Reilly Media, Inc.
Content preview from 数据治理:权威指南

附录 A. 谷歌内部数据治理

为了了解数据治理,我们不妨看看一家公司在这一主题上的实际案例。我们(作者)都是谷歌的员工,我们相信,在谷歌,我们有一个根深蒂固的流程和工具的典范。

谷歌数据治理的商业案例

谷歌将用户隐私放在首位,并发布了强有力的隐私原则,在所有产品开发周期中为我们提供指导。这些隐私原则的首要任务包括:尊重用户隐私、数据收集透明化、尽最大努力保护用户数据,这些原则确保了良好的数据管理成为谷歌的核心。

在深入探讨谷歌数据治理和管理的具体细节之前,了解谷歌收集数据背后的动机和使用案例至关重要。这对任何工作来说都是一个好方法。谷歌提供对搜索结果和视频的访问,并在搜索结果旁展示广告。谷歌的收入(与几年前相比更加多元化)主要来自广告。

鉴于广告的重要性,谷歌的大部分工作都集中在使广告具有相关性上。为此,谷歌收集最终用户的数据,为这些数据建立索引,并为每个用户提供个性化的广告。

谷歌对这些信息是透明的:当用户使用谷歌服务时--例如,当用户在谷歌上搜索、在地图上导航或在 YouTube 上观看视频时--谷歌会收集数据以个性化这些服务。这可能包括突出显示用户过去观看过的视频,根据用户的位置或经常访问的网站显示与用户更相关的广告,以及更新用户用于访问谷歌服务的应用程序、浏览器和设备。例如,当用户使用移动设备在谷歌地图上进行搜索与使用网页浏览器在台式机上进行搜索时,搜索结果和相应的广告可能会有所不同。如果用户已登录,则可获得与用户谷歌账户相关的个人信息。这些信息包括用户的姓名、生日、性别、密码和电话号码。根据用户使用的 Google 属性,这些信息还可能包括用户撰写和接收的电子邮件(如果用户使用的是 Gmail);用户保存的照片和视频(如果用户使用的是 Google Photos);用户创建的文档、电子表格和幻灯片(如果用户使用的是 Google Drive);用户在 YouTube 上发表的评论;用户在 Google 通讯录中添加的联系人和/或 Google 日历上的事件。在使用 Google 服务时,有必要保护所有这些用户信息。

因此,谷歌为每位用户提供了透明度,让他们能够控制个人信息的使用方式。用户可以通过进入谷歌广告设置来了解他们的广告是如何被个性化的,并可以控制其中的个性化。他们还可以关闭个性化,甚至删除自己的数据。他们可以查看自己在谷歌域内的活动,删除或控制活动收集。这种透明度和控制水平是用户所期望的,这样他们才能放心地向企业提供个人信息。谷歌在收集哪些数据以及如何使用这些信息来创造上述收入方面保持着透明度。如果你正在收集个人信息并将其用于个性化服务,你也应该提供类似的机制,让你的客户可以查看、控制和修改你对其个人信息的使用。

鉴于谷歌收集的所有信息,谷歌公开承诺保护这些信息并确保隐私也就不足为奇了。谷歌对外部认证和认可一丝不苟,并为个人消费者提供了控制所收集数据的工具。

谷歌数据管理的规模

谷歌对自己的一些信息保密,例如它实际收集和管理了多少数据。一些公开信息提供了一个大致的概念,比如谷歌据说将在 2020 年向办公室和数据中心投资 100 亿美元。1有第三方试图利用公开信息估算谷歌的数据存储容量,结果得出了 10EB(艾字节)的信息2

关于谷歌数据编目工作、其规模以及组织数据的方法的更多信息,请参阅谷歌 "Goods "论文。3本文讨论了谷歌 数据集 搜索(GOODS)方法,该方法不依赖于利益相关者的支持,而是在后台收集元数据并为元数据编制索引。由此产生的目录可用于进一步用业务信息注释技术元数据。

那么,面对数量如此庞大、种类如此繁多的信息(其中很多可能是敏感信息),谷歌如何保护所收集的数据,并在保证数据可用性的同时确保隐私呢? ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

流畅的Python(第2版)

流畅的Python(第2版)

Luciano Ramalho
数据质量基础知识

数据质量基础知识

Barr Moses, Lior Gavish, Molly Vorwerck
元数据管理基础

元数据管理基础

Ole Olesen-Bagneux

Publisher Resources

ISBN: 9798341657168