
42
|
第
3
章
通过将每个问题都视为新问题来处理,我们可以确定在生产过程中出现问题时真正发生
了什么,而不是简单地将其与最近的类似问题进行模式匹配。这使得对给传统方法带来
最大挑战的系统进行有效故障定位成为可能。
我们现在可以快速有效地诊断以下问题:
•
跨越多个运行时的微服务和请求。
•
面对多种存储系统,不需要每个系统的专业知识。
•
多租户和运行时服务器端代码和查询;我们可以轻松地深入了解个人用户体验,以
确切了解发生了什么。
即使我们剩下的少量单体系统使用了无聊的技术,但所有可能的问题都被很好地理解
了,我们仍然获得了一些收获。我们不一定会发现任何新的东西,但结果是我们能够更
快、更自信地发布软件。
在
Parse
,个人提升最快的途径是学习如何使用可观测的系统。通过在适当的抽象级别
收集应用程序遥测数据,围绕用户体验进行聚合,并能够实时分析,我们获得了神奇的
见解。一旦我们有能力提出任何问题,链路追踪每一个步骤,并通过观测应用程序的输
出来了解任何内部系统状态,我们就消除了传统工具的局限性。一旦有了可观测性,我
们就能够使自己的实践现代化。
3.6 结论
这个故事来自我在
Parse
的工作经历,说明了组织如何以及为什么要从传统的工具和监
控方法过渡到使用现代分布式系统和可观测性来扩展其实践。
2015
年,在
Facebook
宣
布关闭
Parse
托管服务之前不久,我离开了
Facebook
。从那时起,随着软件行业转向采
用类似技术,我和我的团队在管理现代分布式系统时面临的许多问题才变得更加普遍。
Liz
、
George
和我相信 ...