
25
第 2 章
评估和选择数据管理解决方案
你可能已经意识到,在开始一个新项目时,技术选型有多么重要。选择正确的解决方案是
一个复杂的过程,它会对组织产生长远的影响,并直接影响数据项目能否取得成功。是重
用可信赖的解决方案,还是尝试新方案,或是步行业领头羊的后尘?在选择解决方案时,
我们必须面对这些艰难的决策。
在决策过程中,你可能会看到市场炒作、来自供应商的夸大承诺、能够提供不同解决方案
的分析师以及拥有忠实用户基础的工具。其中一些解决方案可能适合你的项目,有些则可
能不太适合。后者只会浪费时间和金钱,让你感到挫败。
本章的目的是帮助你在技术选型过程中做出最好的选择。首先,讨论开源项目的一些常见
的生命周期,这些知识有助于了解开源项目的健康状况、项目处在生命周期中的位置,以
及抛开炒作(不管有没有)看看项目是否适合系统。然后,讨论用于评估项目的一些指
标,例如性能测试或基准测试的结果。最后,深入探讨一些项目技术选型模式。
你很可能会问:为什么本章要关注开源项目?可以采用商业解决方案吗?关注开源项目的
主要原因是,很多较新的大数据平台都是开源项目,而且很多现代专有解决方案也是基
于开源软件或利用了开源软件,在某些情况下甚至会复制开源解决方案的功能。当然也
有例外——
Teradata
是一个闭源的商业数据管理解决方案,它可以存储和处理海量数据。
在云计算领域,亚马逊
Web
服务(
AWS
)提供了专有产品,例如简单存储服务(
Simple
Storage Service
,即
Amazon S3
)和
Kinesis
,它们主要用于存储和处理大数据 ...