
16
|
第
2
章
监控惯例
是非常宝贵的。在实际中,具有十年数据保存策略的用户并不少见!
我们不会在本书中深入讨论容量规划,但重要的是要了解容量规划的用途并了解其与通
过
Graphite
收集的时间序列数据之间的关系。为了适当了解这个主题,强烈推荐你阅
读
John Allspaw
编写的《
Web
容量规划的艺术》和
Neil J. Gunther
博士编写的
Guerrilla
Capacity Planning
等图书。
你会经常听到我提到
趋势
这个词,因为我们对存储、检索和分析时间序列数据的各种应
用程序更感兴趣。令人确信无疑的容量规划总是隐藏在阴影中,随时可以执行。
重新审视轮询
/
拉取模型
拥有一个符合逻辑的关于监控系统的公共术语表很重要。近几年,单体监控系统演变为
离散的功能组件就是在这方面取得最大进步的例证之一。因此,我们会比以往任何时候
都能更好地理解功能模块的能力和职责。目前,在监控领域最大的发展之一或许就是产
生了监控新工具和新框架。
多年来,有些企业一直认为
Nagios
是用于主机和服务监控的开源工具的唯一选择,因为
它对于大多数场景而言“足够好”,所以从来没有足够的“操作焦虑”来推动该领域的创新。
回顾过去五年,我们可以看到面向服务架构的发展(最近称为
微服务
)与开源监控工具
的发展之间的相似之处。用户和开发人员开始意识到,不必重新发明整个轮子
;
目前就
可以构建和发布小型、好用的工具以模拟老接口并涵盖特定功能 :告警、通知、图表功
能等。目前,许多企业都使用各种各样的工具来构建它们的监控架构。
目前大多数
CIO ...