
513
18
장
복구와 사후처리
18.1
복구 전략
앞 장에서도 설명했지만 사고를 잘 관리하면 병렬적으로 대응할 수 있다. 병렬화
parallelization
는
복구에 특히 유용하다. 여기서 복구를 수행하는 사람은 여러 가지 이유로 사고를 조사한 사람
과는 다른 사람이어야 한다.
●
사고의 조사 단계는 시간이 많이 소요되고 상세하며 장시간의 집중을 요한다. 사고 대응이 길어지면 조
사 팀은 복구가 시작되는 시점에 이미 휴식이 필요한 경우가 많다.
●
사고의 복구 단계는 아직 조사가 진행 중일 때 시작할 때도 있다. 그 결과 별도의 팀이 병렬로 진행하면
서 서로 정보를 주고 받아야 한다.
●
조사를 수행하기 위해 필요한 스킬은 복구에 필요한 스킬과는 다를 수 있다.
복구를 준비하며 옵션을 고려할 때는 공식적인 팀을 구성해야 한다. 사고의 범위에 따라 이 팀
은 팀원이 한 명일 수도 있고 전체 조직만큼이나 규모가 큰 팀일 수도 있다. 사고 내용이 복잡
한 경우에는 공식 팀, 잦은 회의, 공유 문서 리포지토리, 쌍방향 검토 같은 조율 메커니즘을 구
현할 것을 권한다. 많은 조직이 스프린트
sprint
, 스크럼
Scrum
팀, 탄탄한 피드백 루프 같은 기존의
애자일 개발 절차를 적용해 복구 팀 운영을 모델링하고 있다.
역할과 책임
이번 장에서 다루는 주제는 소수가 진행하는 오픈 소스 ...