
16
第
1
章
在云计算中运行时,我们不会注意针对水平扩容和自动扩容的细节(在第
6
章中,
我们详细介绍了为什么它是不平凡的设置自动缩放政策)。“重量级”的实例类
型和预留空间(仔细调研的结果)是资源快速消耗的两个常见原因。文章“你的
公司不应该犯的三个基础设施错误”强调使用公共云服务在规模上变得非常昂贵。
与
Netflix
相反,许多其他大公司(例如但不限于
Dropbox
),从一开始就拥有公
有云的基础设施,并已经迁移到自己的数据中心。本书提供了从公有云迁移到运
行你自己的基础设施的指导。
即使在数据中心的背景下,容量规划会由于缺乏细节的错误而产生严重的影响。
这在一定程度上源于长期的供应链周期和与供应和配置相关的开销。相比之下,
独立于成本方面的考虑,云的弹性大大降低了峰值负载不足的可靠性风险。
如果你感兴趣的是一个更正式或学术处理的主题——容量计划,请参阅本章后面
的“延展阅读”。
预测你的系统何时会崩溃
了解每一个基础设施何时会崩溃(优雅与否)是容量计划的关键。在目前情况下
崩溃意味着我们的服务情况没有达到
SLA
(服务水平协议)(在第
2
章讨论),
IT
领域这个就是“优雅地”降解性能或者导致“真正的”系统故障(确定对应于
后者的范围是在第
3
章中详细讨论)。对于
Web
或移动
App
的容量规划,通常比
我们预估的要多很多),看起来像图
1-4
所示的方法。
图
1
-
4
:找到故障点
将这些信息作为你容量预估时需要考虑的一部分,是强制而非可选的。但是,要
想确定你网站后台每一部分的限制可能十分棘手。一个简单同时可拆分的体系架