
23
容量规划的目标
、
问题和过程
─ 波动统计
像新发布版本或服务器异常这样的内因,像奥运会或超级碗这样的外
因,它们是如何影响高层次的目标和每个组件的剩余容量的呢?例如,
通常,剩余容量空间的瓶颈对即将到来非预期流量非常敏感。
哪种方式可以提升系统输入流量的负载?例如通过每个组件的排队。
此外,考虑到并非所有输入的流量都具有同等重要性,例如在地震中
搜索重要的人或者幸存者名单,支持与瓶颈相关队列的优先级调度是
很重要的。
例如,通过设置优雅降级,在不影响高级目标的情况下,对每个组件
进行剩余容量和队列之间的权衡。注意,消耗剩余容量有助于排空队
列。然而,它也许不能服务于高容量和高优先级的流量。相反,以排
队为代价维持一个健康的剩余容量可能会导致违反
SLA
。
•
灵活处理请求冲突和改变优先级
─ 例如,在
Web
搜索的上下文中,提高搜索引擎的爬虫和排序组件的新鲜度
和排序练习压力。给定固定的
CAPEX
预算,上述组件对额外容量的要求
可能彼此冲突。这一点本身就有可能被取消优先级,例如,支持新产品的
推出所需的能力。
─ 为解决上述情况设立政策并非罕见。然而,这种政策往往不符合他们的目
标。这可以部分归咎于:①政策,从定义上讲,生产过程中不断变化的现
实情况是不可延展的;②围绕这些政策必然会产生官僚主义框架,这反过
来又会导致惯性和减缓决策过程。
•
与产品和工程团队紧密合作
─ 这对于方便评估未来容量需求是至关重要的。考虑到采购周期会比较长,
最重要的是对未来的产能需求做出预测而不是反应。即使在云计算的背景 ...