
136
|
第
13
章
13.5 结论
我们已经研究了错误预算所起的作用以及在使用
SLO
时可用来触发告警的机制。有几
种预测方法可以用来预测你的错误预算何时会被消耗掉。每种方法都有自己的考虑和权
衡,希望本章能告诉你使用哪种方法来最好地满足你的特定组织的需要。
SLO
是一种现代化的监控形式,它解决了我们之前概述的噪声监控的许多问题。
SLO
并
不是特定于可观测性的。特定于可观测性的是事件数据为
SLO
模型增加的额外力量。在
计算错误预算的消耗率时,事件提供了对生产服务实际状态的更准确的评估。此外,仅
知道
SLO
有被破坏的危险,并不一定能提供你所需要的洞察力,以确定哪些用户受到
影响、哪些依赖服务受到影响,或者哪些用户行为组合在你的服务中触发了错误。将可
观测性数据与
SLO
结合起来,可以帮助你在触发消耗预算告警后看到故障发生的地点和
时间。
将
SLO
与可观测性数据一起使用是
SRE
方法和可观测性驱动开发方法的一个重要组成
部分。正如在前几章所看到的,分析失败的事件可以提供丰富而详细的信息,说明什么
地方出了问题以及为什么。它可以帮助区分系统性问题和偶发的零星故障。在下一章,
我们将研究如何利用可观测性来监控生产应用程序的另一个关键部分:软件供应链。
可观测性工程 正文.indd 136可观测性工程 正文.indd 136 2023-7-21 9:01:462023-7-21 9:01:46