
|
397
管理数据
就像一份报告或分析仪表板很少能立即投入生产一样,并非所有的数据都能在第一
次就完美地准备好。经常需要根据其他使用数据的用户的反馈进行迭代。这就是为
什么需要开发环境来测试数据准备流程以及生成的数据集的原因。只有当数据资产
经过测试并被批准广泛使用和在关键报告中使用后,才应该将流程转移到生产环境
中。同样,生产环境的控制更为严格,因此大多数人不具备向其写入内容的权限,
他们也不应该这样做,以免犯下很难解决的错误。
44.4
删除数据
那么,如果你理解了数据的敏感性,并且在将流程发布到生产环境之前,已经在开
发环境中测试了数据集,这就完成了吗?嗯,还没有。你还需要考虑何时删除数据。
在本节中,我们将介绍这样做的两个最常见的原因。
44.4.1
当数据变得过时或不相关时
随着时间的推移,数据可能会变得不那么相关,也可能不那么准确。当创建一个数
据源时,应该考虑保留该数据的时间。显然,指定一个日期来删除表或记录,并不
意味着你必须到了那个时间就这么做。你可以随时重新评估数据的相关性和准确性,
但设定一个日期至少可以让你避免推迟保留或删除数据的决定。
44.4.2
当客户或顾客离开时
你应该只在法律允许的时间内保留数据。随着
2016
年欧盟出台
General Data
Protection Regulation
(《通用数据保护条例》,
GDPR
)以来,这一规则变得更加严格。
当客户离开时,应该删除详细的客户数据。为了能够做到这一点,你必须知道或能
够找出该客户的所有数据实际位于哪里──在什么系统中的哪些表中。如果数据是 ...