
防灾规划
|
259
短期恢复阶段应包括制订事件的退出标准,即宣布事件响应完成的标准。恢复成功意味着
将服务恢复到完全可操作的状态,但底层解决方案可能是新设计的,能提供相同的服务级
别。该标准还可以要求解决通过风险分析发现的安全威胁。
在制订针对即时响应、短期恢复、长期恢复以及恢复运营的战略时,可以通过以下方式做
准备。
•
分析可能影响组织或造成严重后果的潜在灾害。
•
组建响应团队。
•
制订响应计划和详细的行动手册。
•
恰当地配置系统。
•
测试流程和系统。
•
采纳测试和评估得出的反馈。
16.3
灾难风险分析
开展灾难风险分析是确定组织最关键操作的第一步。如果缺失这一步,将导致系统完全瘫
痪。关键的操作功能不仅包括重要的核心系统,还包括底层依赖关系,如网络和应用程序
层组件。灾难风险分析应确定以下内容。
•
有一类系统,如果它们被破坏或掉线,可能导致操作失效。可将其分为任务关键型、任
务重要型或非必要型。
•
应对事件所需的技术或人力资源。
•
每个系统可能面临的灾难场景。可按发生的可能性、频率和对操作的影响(低、中、高
或关键)对其进行分组。
虽然可以凭借直觉对进行运维情况评估,但采用更正式的风险评估方法有助于规避从众思
维,从而暴露出隐藏较深的风险。为了使分析更彻底,我们建议使用标准化矩阵对组织面
临的风险进行排序,罗列每种风险发生的概率及其影响。附录提供了一个风险评估矩阵样
例,无论组织大小都可以视系统的具体情况进行定制。
为了解决注意力首先应集中在哪里,风险评级提供了一套很好的经验法则。对潜在异常值
进行评级排序后,应复查该风险列表。例如 ...