
企业元数据
|
105
会非常大。不仅需要知道某个人的数据保存在公司的什么地方,还需要弄清楚如何以有效
的方式查询数据,以及如何在不泄露内部数据系统的机密信息的情况下显示数据。
删除个人信息的权利
任何人都可以要求删除与其相关的数据或对数据做出修改。这也可能对系统产生重大影响。
限制数据应用的权利
公司只能将收集到的数据用于某些特定的目的,并需要在个人同意公司提供的服务条款之
后才这样做。这也将影响到数据系统,因为它要求公司收集那些使用了特定数据的处理类
型的信息。
安全性影响评估
企业有必要快速知道哪些数据在遭遇黑客攻击时受到了损坏。了解收集了哪些数据及其存
储位置对于这类评估来说至关重要。这涉及前面提到的所有考虑事项:有关数据的知识、
数据之间的关系、理解与数据有关的访问和处理情况,等等。
拥有元数据对于满足上述监管要求至关重要。如果不知道从某个客户那里收集了哪些数据
以及存储于何处,那么就无法遵守“删除个人信息的权利”规则。
6.2
数据架构中的元数据类型
前文已经讨论了元数据的重要性,并说明了为什么需要一个好的元数据策略。接下来讨论
在制定可行的策略时需要关注哪些元数据类型。
静态数据
静态数据是已经被摄取到磁盘存储(在某些特殊情况下是内存)上的数据的元数据。可
以是长期存储的,例如
Hadoop
分布式文件系统(
HDFS
);也可以是短期存储的,例如
Kafka
主题。
动态数据
一般来说,动态数据是通过数据管道传输的数据。
数据源(实体)的元数据
数据源(实体)的元数据包括在
6.1.2
节中讨论的实体类型。