
148
|
第
14
章
在回滚了一些有问题的提交代码之后,由于事件调查中可能还存在大量的变更,所以在变
更之后和可观测性反馈之前的这段时间,经常会出现一个空档期。图
14-10
展现了相关专
家在排错时可以快速进行假设,并且用近乎实时的分布式链路追踪查看系统的健康状况。
“我们如何最好地
检验假设?”
“恢复后测试
刚刚通过。”
“我们应该能够看到你
在 Honeycomb 中 维 行
时的内存使用率。”
图 14-10 :事件调查期间的一系列问题,从测试假设开始,到采取行动,并且使用可观测性来
验证假设(出于隐私原因,对处理人姓名进行了模糊化)
这些数据让
Slack
可以根据时间查看带有上下文的遥测数据。这是
Slack
平时运营中使
用可观测性的众多示例之一。你可以通过将可观测性嵌入你的事件处理流程中,采用类
似的方法来识别变更和中断。
14.4 结论
本章说明了可观测性如何在软件供应链中发挥作用。我分享了
Slack
如何探测
CI
流水线
以及如何调试分布式系统的示例。开发人员了解生产环境中的代码情况,首先要考虑的
应该是调试分布式系统的复杂性。但是,在发布到生产环境之前,如何正确理解和调试
分布式系统同样具有挑战性。
借助软件供应链中正确的工具和方法,
Slack
工程师能够解决整个
CI
工作流中以前难以
发现的复杂问题。无论是处理“调试应用程序速度缓慢”还是处理“
CI
测试不可靠”,
可观测性都可以帮助开发人员通过交互的方式发现和解决高复杂性系统中的问题。
可观测性工程 正文.indd 148可观测性工程 正文.indd 148 2023-7-21 ...