
|
413
保持数据更新
每种类型的刷新都会带来各自的问题,但可以通过本章介绍的不同技术来进行处理。
当第一次导入或接收一个数据集进行分析时,你应该询问该数据是否会刷新。如果
答案是肯定的,则可能需要在每次有新数据时重新运行数据准备流程。了解刷新的
频率很重要,有时对“实时”报告的数据分析请求,会受到原始数据源更新频率的
影响。另外,还应该评估报告需要“新鲜”数据的频率,因为在很多情况下,数据
可能会不断刷新,所以如果报告要每天刷新一次,就需要确定一个时间截止点。
47.2
完全刷新
vs
增量刷新
顾名思义,完全刷新是指数据集的完全更新,而增量刷新只是部分刷新。在完全刷
新时,原始数据集的所有记录都被删除,并被更新后的数据源中的记录所取代。因此,
完全刷新通常是不可逆的,因此你应该在运行流程之前检查数据,以确保数据不会
被无意中删除或覆盖。
增量刷新只使用最新的记录来更新现有的数据集。通常,这些新记录被添加到现有
数据集的末尾。这种类型的刷新所带来的风险较小,因为只要没有出现覆盖,就可
以随时删除那些被添加进来的记录。
在
Tableau Prep Builder
中,开发团队通过允许增量刷新覆盖现有数据点来增加其灵
活性,从而使数据源中只保留最新的数据点。对于大多数
Tableau Desktop
和
Server
用户来说,这将是一个新的概念,因为以前没有这个功能。对于完全刷新,不是覆
盖原有的数据集,而是可以将新数据添加到现有数据集的末尾,形成一个历史表,
留存一段时间内的数据快照。
47.3
设置不同类型的刷新
完全刷新和增量刷新这些新的方法允许你为许多不同的场景设置刷新模式。 ...