
334
|
第
21
章
个月未打安全补丁而被追责,但是很多人正在休假,每个人都在围绕这笔大交易忙得焦头
烂额。在这种情况下,公司文化支持员工做出什么样的决定?尽管有导致大交易延迟的风
险,一个有着良好安全文化的健康组织会鼓励员工立即报告事件。
假设在调查恶意入侵者时,前端开发团队不小心将原本做暂存的重要变更推向了正式生产
系统。这个错误使公司的现金流业务掉线超过
1
小时
,客服热线也被打爆了。这导致用户
信任感急速流失。可靠性文化会鼓励员工重构流程,容许意外的前端推送发生,以便团队
能够管理用户需求,并规避重大交易取消或延迟的风险。
在这种情况下,文化规范应鼓励借助不强调过失的复盘来暴露可修正的问题,进而避免后
续再出现问题
1
。具备健康文化的公司清楚,被渗透一次很痛苦,被渗透两次就更糟了。同
样,他们知道
100
%永远不是正确的可靠性目标
。使用错误预算(
error budget
)
2
之类的工
具,并做安全代码推送控制,有助于在可靠性和速度之间取得适当的平衡,进而使用户满
意。最后,拥有健康安全性和可靠性文化的公司知道,从长远来看,当事件不可避免地发
生后,保持透明可赢得用户的赞许,而对事件遮遮掩掩则会削弱用户的信任感。
本章介绍了一些用于建立安全性和可靠性文化的模式和反模式。尽管我们希望这些信息对
各类组织都能有帮助,但每个组织的文化都是特别的,它是根据组织的面临的特定挑战和
特性而定的。不同组织有不同的文化,本章提供的建议并非对所有人都适用。本章旨在提
供一系列有关文化主题的想法,但并非所有组织都能全盘采纳文章讨论的所有实践。我们 ...