
from Scratch
173
보통 모델을 선택하기 위해서는 정밀도와 재현율의 트레이드오프(
trade
-
off
)
를 고려해야 한다. 특정 데이터 포인트가 조금이라도 양성일 것 같을 때 모델이
데이터 포인트를 양성이라고 판단한다면, 재현율은 높겠지만 정밀도는 낮을 것
이다. 반면 모델이 데이터가 확실히 양성일 때만 해당 데이터를 양성이라고 판
단한다면 재현율은 낮겠지만 정밀도는 높을 것이다.
다르게 생각해 보면
false
positive
와
false
negative
의 트레이드오프로 볼 수
도 있다. 너무 자주 양성이라고 판단하면
false
positive
가 증가할 것이다. 반면
에 자주 음성이라고 판단하면
false
negative
가 증가할 것이다.
예를 들어 백혈병을 유발하는
10
가지 위험 요소가 존재하고, 더 많은 위험 요
소를 보유할수록 발병 확률이 높아진다고 해보자. 이런 경우 적어도
1
개의 위험
요소를 보유할 때 발병 여부를 예측해 보고, 적어도
2
개의 위험 요소를 보유할
때 발병 여부를 예측하는 등 순차적으로 발병 여부를 판단할 수 있다. 위험 요소
의 개수를 증가시키면 발병 확률이 높아지기 때문에 판독 방법의 정밀도는 증
가한다. 하지만 위험 요소의 개수가 증가하면 점점 더 적은 수의 환자가 양성으
로 판정되기 ...