393
16
장
쿠버네티스 메트릭
기 때문이다. 하지만 해당 데이터는 접근할 수 없기 때문에 가능한 것만 수집한다. )
모든 요청은 저마다 소요 시간이 다르다. 그렇다면 수백 또는 수천 개의 요청 데이터를 단일 숫
자로 집계하는 방법은 무엇일까?
16.3.1
단순 평균의 문제점
확실한 방법은 평균을 구하는 것이다. 하지만 자세히 살펴보면
평균
이 의미하는 것은 간단하지
않다. 통계학의 오래된 농담으로 ‘보통 사람의 다리는 두 개보다 약간 적다’라는 말이 있다. 다
르게 얘기하면 대부분의 사람은 사람의 평균 다리 수보다 더 많은 다리를 갖고 있다. 어떻게 이
럴 수 있을까?
대부분의 사람은 다리를 두 개 갖고 있지만 일부는 다리가 하나이거나 없을 수 있다. 이런 경우
가 전체 평균을 낮춘다(아마도 다리를 두 개 이상 가진 사람이 있을 수도 있다 ). 이런 단순 평
균으로는 인구의 다리 분포에 대한 유용한 정보를 얻을 수 없다.
또한 평균의 종류도 다양하다. 흔히 사용하는
평균
average
의 개념은
산술
평균
mean
을 의미한다. 산
술 평균은 모든 수의 합을 수의 개수로 나눈 값이다. 예를 들어 세 사람의 평균 나이는 전체 나
이를 합해
3
으로 나눈 값이다.
반면에
중앙값
은 주어진 값을 순서대로 나열했을 때 가장 중앙에 있는 값을 말한다. 값의 집합
을 반으로 나누면 절반은 중앙값보다 큰 값을 가지며 나머지 절반은 작은 값을 가진다. 예를 들
어 열 사람 중에서 절반은 신장의 중앙값보다 키가 크고 나머지 절반은 작다.
16.3.2
산술 평균, 중앙값, ...