
195
第 18 章
使用流水线进行遥测管理
本章由 Slack 高级软件工程师 Suman Karumuri 和工程总监 Ryan Katkov 共同撰写
Charity
、
Liz
和
George
的小提示
在本书的这一部分,我们详细了解了可观测性的概念,这些概念在系统规模大时最
容易体现出来,但是出于各种原因,它们在任何系统规模下都是有用的。在前一章,
我们研究了当典型的可观测性数据量从小变到大时会发生什么,以及如何通过采样
来减少数据量。在本章中,我们将研究管理大量遥测数据的另一种方法:流水线。
除了数据量,遥测流水线还可以帮助管理应用程序的复杂性。在更简单的系统中,
来自应用程序的遥测数据可以直接发送到对应的数据后端。在更复杂的系统中,你
可能需要将遥测数据路由到许多后端系统,以隔离工作负载、满足安全性和合规性
需求、满足不同的保留要求等。当你在此基础上添加数据量时,管理该数据的遥测
生产者和消费者之间的多对多关系可能会变得非常复杂,但遥测流水线可帮助你抽
象出这种复杂性。
本章由 Suman Karumuri 和 Ryan Katkov 撰写,会详细介绍 Slack 是如何使用遥测流
水线来管理可观测性数据的。与第 14 章相似,Slack 的应用基础设施是一个很好的
例子,它优雅地解决了复杂性和规模上的问题,为工程师在任何规模上使用可观测
性提供了有用的概念。我们很高兴能够在本书中与你分享这些经验。
本章的其余部分是从 Suman 和 Ryan 的角度讲述的。
在本章中,我们将介绍遥测流水线如何使你的组织可观测性能力受益以及遥测流水线的基 ...