book

混沌工程

by Casey Rosenthal, Nora Jones

July 2025

Intermediate to advanced

308 pages

3h 7m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

本书使用的约定O'Reilly 在线学习如何联系我们致谢
作为代码的管理原则混沌猴诞生Go Big学科正规化社区诞生快速发展
思考复杂性遭遇复杂性示例 1：业务逻辑与应用逻辑不匹配示例 2：客户引发的重试风暴示例 3：假日代码冻结面对复杂性意外复杂性基本复杂性拥抱复杂性
动态安全模型经济性工作量安全复杂性的经济支柱状态关系环境可逆性应用于软件的复杂性经济支柱系统视角
什么是混沌工程实验与测试验证与确认混沌工程不是什么破坏性反脆弱性高级原理围绕稳态行为建立假设改变真实世界的事件在生产中运行实验自动化实验以持续运行最小化爆炸半径原则 "的未来
混沌改造旧系统中常见的设计模式较新系统中常见的设计模式实现基本容错灾难作品剧场目标反目标过程准备工作演练汇报过程如何演变获得管理层的支持结果避免缓存不一致尝试，再尝试（为了安全）不可能的结果总结
DiRT 测试的生命交战规则测试什么如何测试收集结果谷歌的测试范围总结
为什么一切都如此复杂？意外复杂情况举例简单系统只是冰山一角实验结果分类已知事件/意外后果未知事件/意外后果故障优先级探索依赖关系差异程度故障变化将变化和优先级相结合将变异扩展到依赖关系大规模部署试验结论

从灾难中学习细化实验目标安全地进行大规模实验在实践中LinkedOut故障模式使用 LiX 确定实验目标用于快速实验的浏览器扩展自动化实验结论
Capital One案例研究盲目弹性测试向混沌工程过渡CI/CD 中的混沌实验设计实验时应注意的事项工具团队结构宣传结论
混沌工程与复原力混沌工程周期的步骤设计实验混沌实验设计的工具支持有效的内部合作了解操作程序讨论范围假设结论
系统中的人类在社会技术系统中加入 "社会 "元素组织是一个系统的系统工程适应能力发现薄弱信号失败与成功，一枚硬币的两面将原则付诸实践建立假设改变真实世界的事件最小化爆炸半径案例研究 1：游戏日通信：任何组织的网络延迟案例研究 2：连接点领导力是系统的新兴属性案例研究 3：改变基本假设安全地组织混乱你需要的只是高度和方向闭环如果你没有失败，你就没有在学习
实验的原因、方法和时间为什么如何何时功能分配，或 "人定胜天"/"机定胜天替代神话结论
选择实验随机搜索专家时代可观察性：机会直觉工程的可观察性结论
减少事故的短暂性柯克帕特里克模型第一层：反应第二级：学习第 3 层次：转移第四层：结果替代投资回报率示例附带投资回报率结论
合作心态开放科学；开放源代码开放式混沌实验实验结果、可共享结果总结
采用谁参与了混沌工程有多少组织参与了混沌工程先决条件采用的障碍复杂性将所有内容整合在一起
简历的来源履历系统的类型野生 CV：ChAPChAP：选择实验ChAP：运行实验ChAP 中的高级原理作为持续验证的 ChAPCV 即将进入您身边的系统性能测试数据工件正确性
网络物理系统的兴起功能安全与混沌工程FMEA 和混沌工程网络物理系统中的软件超越 FMEA 的混沌工程探针效应解决探针效应结论
什么是人与组织绩效 (HOP)？HOP 的关键原则原则 1：错误是正常的原则 2：指责不能解决问题原则 3：环境影响行为原则 4：学习和改进至关重要原则 5：有意回应很重要HOP 与混沌工程混沌工程与 HOP 的实践结论
我们为什么需要混沌工程？鲁棒性和稳定性真实世界的例子应用混沌工程我们拥抱混沌的方式故障注入应用程序中的故障注入CPU 和内存中的故障注入网络中的故障注入文件系统中的故障注入检测故障混沌自动化自动化实验平台：薛定谔薛定谔工作流程结论
现代安全方法人为因素与故障清除低垂的果实反馈回路安全混沌工程和当前方法红色团队的问题紫色团队的问题安全混沌工程的益处安全游戏日安全混沌工程工具示例：ChaoSlingrChaoSlingr的故事结论撰稿人/审稿人

Content preview from 混沌工程

第 15 章混沌成熟度模型混沌成熟度模型

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

当 Netflix 的团队写出第一本关于混沌工程的书时，他们提出了 "混沌成熟度模型"、¹他们提出了 "混沌成熟度模型"。这最初只是一个玩笑，是对80年代末/90年代初的CMM--卡内基梅隆大学为分析软件开发过程而开发的 "能力成熟度模型"--的一种模仿。该框架是一个非常严谨的过程，与 Netflix 的文化形成了鲜明对比，在 Netflix，"过程 "是一个不好的词。

当 Netflix 的团队使用这个模型时，发现它确实很有道理。事实证明，这并不是一个玩笑。混沌成熟度模型实际上提供了价值，特别是对于那些正在寻找评估和增加对混沌工程实践投资的方法的组织来说。

，从广义上讲，软件行业作为一个整体，其同质性不足以支持围绕混沌工程的行业标准。基础架构、文化、期望值和成熟度都有很大差异，因此不可能有一个简单的解决方案，为不同公司提供一些基本的可比功能。作为行业标准的替代，混沌成熟度模型提出了滑动尺度，可以对不同的混沌工程实践进行评估，以便进行比较和改进。

本章将混沌成熟度模型（CMM）作为一个框架进行说明。这可用于绘制团队或组织的定位图。如果其他人在混沌工程领域的发展道路能够说明团队的进步潜力，那么该地图就能直观地提示团队可以在哪些方面进行改进。CMM 地图有两个轴：采用度和复杂度。这两个方面都可以单独探讨。

采用

关于混沌工程，一个最常见的问题是如何说服管理层接受这一概念。温斯顿-丘吉尔（Winston Churchill）有一句名言："永远不要让好的危机白白浪费"。这句话非常适用于混沌工程的采用。正如《导言》中所述：正如《混沌的诞生》一书中所描述的，这门学科本身就诞生于 Netflix 的危机之中。Chaos Monkey 是在2008年数据中心向云迁移过程中发生故障时发明的。混沌金刚则是在2012年圣诞节前夕的故障之后发明的。

这可能有点像在追赶救护车，但有时帮助他人的最佳时机恰恰是在他们感受到得不到所需帮助的后果之后。我们曾多次看到，在发生可用性或安全事故后，管理层才愿意实施混沌工程。紧接着，就有了强有力的协调和预算来防止类似事件的发生。作为提高可靠性的少数主动方法之一，这往往是引入混沌工程的最佳机会。

随着这门学科的整体成熟，最终我们会达到这样一个地步：公司会将一定程度的混沌工程作为一项策略强制推行。光是稳健性验证就对合规流程产生了重大影响。但在达到这一目标之前，采用混沌工程通常需要从基础做起。

采用可以分为四个方面：

谁接受了这一理念
有多少组织成员参与
先决条件
障碍

谁支持混沌工程

在采用周期的早期，最容易受到故障或安全事件影响的个人贡献者（ICs）最有可能采用混沌工程，或者出于显而易见的原因寻求采用该学科。随后往往是内部倡导，倡导者通常是 DevOps、SRE 和事件管理团队。在更传统的组织中，这通常由运营或 IT 部门负责。这些团队深知被呼叫处理可用性事件的压力。

当然，让系统重新上线的紧迫性也为学习设置了障碍。很多组织都在努力优化事件审查或学习审查流程，但很少有组织能够找到通往弹性工程（Resilience Engineering）的便捷途径：从已完成的工作中学习，以提高社会技术系统中人员的适应能力。

相反，我们通常看到的是持续关注缩短检测时间和修复时间。努力缩短这两方面的时间固然很好，也是一项必要的工作，但这也是被动的。最终，通过合理的论证、举例或后果，选择 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Reinventing the Organization for GenAI and LLMs

Publisher Resources

ISBN: 9798341662919

混沌工程

by Casey Rosenthal, Nora Jones

第 15 章混沌成熟度模型混沌成熟度模型

采用

谁支持混沌工程

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Reinventing the Organization for GenAI and LLMs

What Employees Want Most in Uncertain Times

What Successful Project Managers Do

How I Built a Personal Board of Directors With GenAI

Publisher Resources

第 15 章 混沌成熟度模型 混沌成熟度模型

采用

谁支持混沌工程

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Reinventing the Organization for GenAI and LLMs

What Employees Want Most in Uncertain Times

What Successful Project Managers Do

How I Built a Personal Board of Directors With GenAI

Publisher Resources

第 15 章混沌成熟度模型混沌成熟度模型

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.