454
4
부
시스템 유지 보수
16.3
재해 위험 분석
재해 위험 분석을 수행하는 것은 조직의 가장 중요한 운영을 결정하는 첫 번째 단계다. 여기서
가장 중요한 운영이란, 이 부분이 제대로 운영되지 않을 경우 절대적인 혼란을 초래하는 부분
을 말한다. 핵심 운영 기능에는 중요한 핵심 시스템만 포함되는 것이 아니라 네트워킹과 애플
리케이션 계층 컴포넌트처럼 그 시스템이 의존하는 부분도 포함된다. 재해 위험 분석은 다음의
사항을 식별할 수 있어야 한다.
●
손상되거나 오프라인 모드에 돌입한 시스템이 정상 운영이 되지 않는다. 시스템은 정상 운영에 필수적
인
essential
것과 중요한
important
것 또는 비필수적인 것으로 구분할 수 있다.
●
사고에 대응하기 위해 필요할 (기술적인 것이든 사람이든) 자원.
●
각 시스템에서 발생할 법한 재해 시나리오. 시나리오는 발생 가능성, 발생 빈도 그리고 운영에 대한 영향
(낮음, 보통, 높음 또는 치명적 등 )으로 구분할 수 있다.
여러분은 직감적으로 운영 상태에 대한 평가를 수행할 수도 있겠지만 조금 더 공식적인 위험
평가 방법은 집단 사고
groupthink
를 피하고 명확할 필요가 없는 위험을 찾아내는 것이다. 포괄적
인 분석을 위해서는 각 위험이 발생할 가능성과 조직에 미칠 영향을 고려해 위험의 등급을 결
정하기를 권한다. 부록
A
는 조직의 규모와 관계없이 시스템을 정의할 때 활용할 수 있는 위험
평가 매트릭스의 예시를 제공하고 있다.
위험의 등급을 결정하면 먼저 신경써야 할 부분을 선택하기