334
5부
관찰 가능성 문화의 확산
●
고장에 대한 수정 작업처럼 운영 업무에 투입되는 시간이 새로운 기능을 개발하고 제공하는 데 할애하
는 시간보다 큰 경우
●
지원팀이 확인하고 재현하거나 해결하지 못한 반복적인 성능 저하로 인해 고객의 서비스 만족도가 낮은
경우
●
엔지니어링팀이 다양한 서비스 상호간의 동작을 파악하는 것과 같은 예상치 못한 대규모의 작업을 처리
하느라 새로운 기능의 릴리스가 몇 주 또는 몇 달씩 지연되는 경우
위와 같은 시나리오에 기여하는 또 다른 요인들이 있다면 추가적인 완화 접근 방법이 필요할
수도 있습니다. 하지만, 이러한 증상을 일반적인 경우보다 더 많이 겪는 팀이라면 아마도 시스
템상에 체계적인 관찰 가능성이 부족한 것이 근본적인 원인일 수 있습니다. 그런 팀들은 기본
적으로 프로덕션 시스템 동작에 대한 이해가 부족하기 때문에 비즈니스 목표 달성에 부정적인
영향을 끼칠 수밖에 없습니다.
19.2
관찰 가능성의 투자 수익률
관찰 가능성의 핵심 중 하나는 이전에는 알지 못했던 질문에 대해 답하거나, 흔히 이야기하는
‘알려지지 않은 불확실성
unknown
unknowns
’를 다룰 수 있게 된다는 것입니다. 핵심 분석 루프
core
analysis
loop
(
8
장 ‘관찰 가능성 확보를 위한 이벤트 분석’ 참조)를 통해 데이터 주도
data
-
driven
분석
이나 애플리케이션 이슈를 디버깅하면 예측하지 못한 방식으로 자주 실패하는 시스템을 효과
적으로 관리할 수 있습니다. 오늘날의 복잡한 분산 시스템이 사실상의 애플리케이션 아키텍처 ...