
第三部分
团队的可观测性
在第二部分,我们研究了可观测性的各个技术层面,这些概念如何相互构建以实现核心
分析循环和从第一性原理进行调试,以及这种实践如何与传统监控共存。在本部分,我
们将介绍涉及的社会和文化实践方面的变化,以帮助推动不同团队采用可观测性。
第
10
章讨论团队在第一次踏上可观测性之路时面临的许多常见挑战。如何以及从何处
开始总是取决于多个因素,而本章将概述我们看到的许多有效技术。
第
11
章重点介绍开发人员工作流程在使用可观测性时的变化。虽然我们在前面的章节
中提到了这个主题,但在这里我们将介绍更具体的步骤。你将了解开发人员在开发阶段
早期把自定义工具添加到代码中所获得的好处,以及如何使用自定义工具调试测试并确
保代码在整个生产过程中正常工作。
第
12
章探讨在使用更复杂的方法监控生产中服务的健康时,可观测性释放的潜力。本
章介绍服务级别目标(
SLO
)以及如何将其用于更有效的告警。
第
13
章在前一章的基础上,演示为什么与使用基于指标数据的
SLO
相比,事件数据是
创建更准确、可操作和可调试告警的关键部分。
第
14
章介绍了团队如何使用可观测性来调试和更好地理解堆栈(比如
CI/CD
构建管道)
的其他方面。该章特邀
Slack
公司的高级软件工程师
Frank Chen
撰写。
该部分着重介绍团队工作流可以改变并受益于可观察性实践
—
通过详细描述各种场景
和用例来解决管理任何规模的现代软件系统的工程团队的常见痛点。在第四部分中,我
们将讨论在大规模使用可观测性工具时遇到的具体而独特的挑战。
可观测性工程 正文.indd 93 ...