
第四部分
大规模可观测性
在第三部分,我们着重于克服起步障碍,以及帮助改变社会和文化实践的新工作流,以
便为你的可观测性采纳计划提供一些动力。在这一部分,我们将研究采用范围另一端的
考虑因素:当可观测性采用成功并大规模实践时会发生什么?
说到可观测性,“大规模”可能比大多数人想象的要大。粗略估计,当测量每天产生的
多达数亿甚至数十亿的遥测事件时,可能存在规模问题。本章探讨的概念在大规模操作
可观测性解决方案时最为敏锐。然而,这些经验对任何采用可观测性的人都是有用的。
第
15
章探讨关于购买还是构建可观测性解决方案的决策。在足够大的规模内,随着商
业解决方案费用的增长,团队将开始考虑是否可以通过自己构建一个可观测性解决方案
来节省更多成本。本章提供了如何最好地处理该决策的指导。
第
16
章探讨为了满足可观测性工作负载的需要,必须如何配置数据存储。为了实现迭
代和开放式调查的功能要求,必须满足几个技术标准。本章将介绍一个关于
Honeycomb
的
Retriever
引擎的案例研究,作为满足这些要求的模型。
第
17
章讨论如何减少大规模管理遥测数据的开销。本章将介绍几种技术,以确保高保
真可观测性数据,同时减少必须在后端数据存储中捕获和存储的事件总数。
第
18
章讨论另一种大规模流水线遥测数据或通过流水线管理的技术。本章由
Slack
的高
级软件工程师
Suman Karumuri
和工程总监
Ryan Katkov
所写,将深入介绍
Slack
如何使
用遥测管理流水线大规模地路由可观测性数据。
本书的这一部分集中在可观测性概念上,这些概念在任何规模上都很有用 ...