
390
|
第
43
章
43.2.3
技术硬件的质量
处理任务的硬件对完成任务所需的时间有很大影响。世界各地的公司给人们支付高
薪,但却给他们配备了老旧的笔记本计算机或处理能力不足的计算机。这种情况会
妨碍人们对数据的处理过程,而且随着数据量的增加,问题只会越来越严重。如果
需要分析的数据集规模很小,那么任何基本的数据准备工作在个人的计算机上还可
能正常进行。但如果数据集规模很大,可能数据准备工具就是一个更好的选择。数
据准备工具通常可以只处理样本数据集(如
Tableau Prep
对大型数据集自动处理那
样),只在需要时才处理完整的数据集。一旦建立了完整的端到端的数据流程和逻辑,
则这种完整的处理可能会在服务器(它具有更强的处理能力)上进行。
43.2.4
数据投资的历史状况
如果组织在历史上已经投资了数据解决方案,并且随着技术的进步继续投资,那么
他们的数据库很有可能包含干净的、可随时使用的信息。在进行数据分析时,你可
以将任何必要的字段添加到数据库中以备将来使用。如果不是这样的话,那么很可
能你将与来自多个零星来源的、较杂乱的数据搏斗。至于你应该在哪里进行数据准
备,并没有明确的答案,很可能需要在数据可视化工具(找出哪些数据是有用的)
和数据准备工具(为未来的使用配置更具战略性的数据源)之间进行切换。
所有这些背景因素都会有助于指导你做出决定,但只有在开始实际工作时,你才能
确定在哪里完成最好。
43.3
软件性能
正如你在本节中所看到的那样,
Tableau Prep
是专门设计用来优化构建数据准备流
程然后执行它的。 ...