Skip to Content
大数据项目管理:从规划到实现
book

大数据项目管理:从规划到实现

by Ted Malaska, Jonathan Seidman
January 2020
Beginner to intermediate
155 pages
3h 17m
Chinese
Posts & Telecom Press
Content preview from 大数据项目管理:从规划到实现
企业元数据
105
会非常大。不仅需要知道某个人的数据保存在公司的什么地方,还需要弄清楚如何以有效
的方式查询数据,以及如何在不泄露内部数据系统的机密信息的情况下显示数据。
删除个人信息的权利
任何人都可以要求删除与其相关的数据或对数据做出修改。这也可能对系统产生重大影响。
限制数据应用的权利
公司只能将收集到的数据用于某些特定的目的,并需要在个人同意公司提供的服务条款之
后才这样做。这也将影响到数据系统,因为它要求公司收集那些使用了特定数据的处理类
型的信息。
安全性影响评估
企业有必要快速知道哪些数据在遭遇黑客攻击时受到了损坏。了解收集了哪些数据及其存
储位置对于这类评估来说至关重要。这涉及前面提到的所有考虑事项:有关数据的知识、
数据之间的关系、理解与数据有关的访问和处理情况,等等。
拥有元数据对于满足上述监管要求至关重要。如果不知道从某个客户那里收集了哪些数据
以及存储于何处,那么就无法遵守“删除个人信息的权利”规则。
6.2
 数据架构中的元数据类型
前文已经讨论了元数据的重要性,并说明了为什么需要一个好的元数据策略。接下来讨论
在制定可行的策略时需要关注哪些元数据类型。
静态数据
静态数据是已经被摄取到磁盘存储(在某些特殊情况下是内存)上的数据的元数据。可
以是长期存储的,例如
Hadoop
分布式文件系统(
HDFS
);也可以是短期存储的,例如
Kafka
主题。
动态数据
一般来说,动态数据是通过数据管道传输的数据。
数据源(实体)的元数据
数据源(实体)的元数据包括在
6.1.2
节中讨论的实体类型。
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Web开发的身份和数据安全

Web开发的身份和数据安全

Jonathan LeBlanc, Tim Messerschmidt
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
管理Kubernetes

管理Kubernetes

Brendan Burns, Craig Tracey

Publisher Resources

ISBN: 9787115457363