数据治理:权威指南
by Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, Jessi Ashdown
第 7 章 数据保护 数据保护
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
数据治理的关键问题之一是保护数据。数据所有者可能会担心敏感信息可能会在未经授权的情况下暴露给个人或应用程序。领导层可能会担心安全漏洞,甚至担心已知人员出于错误的原因访问数据(如查看名人的购买记录)。数据用户可能会担心他们所依赖的数据是如何处理的,或者是否被篡改过。
数据保护必须在多个层面进行,以提供纵深防御。必须保护存储数据的物理数据中心和传输流量的网络基础设施。为此,有必要规划如何对授权人员和应用程序进行身份验证,以及如何提供授权。然而,仅仅确保对办公场所和网络的访问安全是不够的--已知人员访问他们不应该访问的数据,而这些人员又在网络内部,这就存在风险。因此还需要加密等其他形式的保护,这样即使发生安全漏洞,数据也会被混淆。
数据保护需要 Agile,因为新的威胁和攻击载体不断出现。
规划保护
数据管理的一个关键方面是确定不同类型数据资产所需的保护级别。然后,组织的所有数据资产都必须按照这些级别进行分类。
例如,在规划层面,可以规定支付处理系统创建的数据必须安全,因为恶意行为者如果能够访问个人交易数据,就有可能制作虚假订单,并将其计入原始客户的账单。因此,必须在身份验证层面实施这一措施,确保只有被认定为员工的人员和应用程序才能访问支付数据的任何方面。然而,并非所有数据都可供所有员工使用。相反,支付数据可能会按不同级别进行分类。只有按商店位置、日期、库存和付款类型分类的汇总数据才可提供给业务规划人员。只有支付支持团队才有权访问单个交易,即便如此,也只能在定时的基础上对特定交易进行访问,并以支持票据的形式提供客户批准。有鉴于此,有必要确保支付数据不可能外流。数据管理工具和系统必须支持这些要求,必须捕捉违规和违约行为,并发出警报。
最理想的情况是创建一个包含所有数据资产的目录,尽管规划、分类和实施往往可以在更高的抽象层次上进行。例如,要执行上述管理政策,不一定要为所有可能的支付数据聚合创建明确的目录,只需将创建的聚合置于有严格边界的管理环境中即可。
血统和质量
如第 5 章所述,数据沿袭和质量考虑因素是数据治理的关键方面。因此,它们需要成为保护规划流程的一部分。仅考虑原始数据的数据保护是不够的,还需要考虑在数据转换的每个阶段对其进行保护。当根据受保护数据计算集合时,这些集合需要一定程度的保护,通常等于或小于集合。当连接两个数据集时,为连接数据提供的保护级别通常是身份验证和授权权限的交叉值。聚合和连接会影响数据质量,因此治理工作也需要考虑到这一点。如果原始数据的数据保护对任何人或合作伙伴能够访问的数据量都有限制,可能就有必要重新考虑对聚合和连接数据的限制。
脉络和质量检查还能发现错误或恶意使用数据的情况。腐败或欺诈性数据在汇总时可能会更加清晰。例如,本福德定律预测了跨越多个数量级的数值前几位数的相对发生率。数值的末位数字预计会呈正态分布。在汇总、转换后的数据中进行此类统计检查更为容易。一旦发现此类欺诈行为,就必须有能力(通过数据行)追溯变化发生的位置,以及是否是数据保护漏洞造成的。
组织发布并在组织内部使用的数据是可信的,这是组织数据文化的一部分。如第 5 章所述,数据质量仍然是数据保护的基本目标。为此,必须在数据管道中内置 "信任但验证 "保障措施,以便在出现质量错误时及时发现。
保护级别
为资产提供的保护级别应反映与该资产相关的安全漏洞的成本和可能性。这就需要对安全漏洞的类型以及与每种漏洞相关的成本进行编目。不同的保护级别也会产生不同的成本,因此有必要确定在特定保护级别下发生安全漏洞的可能性。然后,需要进行成本分析,平衡不同保护级别之间的风险,并选择保护级别。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access