
58
|
第
6
章
6.3
何时应避免连接到数据库
尽管数据库功能强大,但并不是所有的数据准备任务都适合这个解决方案。数据库
很大程度上需要结构化的、干净的数据。如果你有包含有用信息的数据文件,那么
就应该直接访问这些文件,而不是等待先将它们加载到数据库中。显然,如果这些
文件成为产品化报表或分析的数据源,就可以将它们添加到数据库中。将流程或报
表产品化意味着将针对其设置更严格的限制,以防止意外的修改,并在可能的情况
下允许自动更新。
如果不能获得数据库的权限,这种状况会成为快速、敏捷工作的拦路虎。如果数据
只驻留在数据库中一个你没有权限访问的表上,则别无选择,只能等待。然而,如
果你能更快地从文件中获得信息来源,那么就应该马上启动任务,一旦获得权限时,
就切换到官方数据来源。
数据库在大型组织中被大量使用。事实上,由于频繁的数据更新和查询,以及存储
在组织网络上的数据量非常大,它们的工作速度实际上可能比
Tableau Server
或提
取自其他地方的数据集要慢。作为一种替代方案,
Tableau
有自己的文件类型,称为
Hyper
,用于提取数据集。由于
Hyper
文件的构造是为了在
Tableau
产品范围内使用
而优化的,因此即使在大型数据集上也能提供非常好的性能。如果
Prep Builder
在
使用数据库时开始需要很长时间来处理在数据提取工具内所做的那些事情,请与你
的数据团队合作,看看是否有其他选项来托管数据库之外的数据。
6.4
小结
必须编写程序代码来访问数据库可能是一个障碍,因为这也就会使许多潜在用户无
法获得访问数据库所包含的数据而带来的便利。 ...