142
로우코드 AI
5.3
분류 모델 및 지표
모델을 학습시키기 전에 먼저 분류 모델의 정확한 의미와 이를 올바르게 평가하는 방법을 알
아봅시다. 수학적인 내용은
7
장의 뒷부분에서 자세히 다루지만, 분류 모델의 기본 작동 방식만
이해해도 결과를 해석하고 모델에서 문제가 될 만한 동작을 알아챌 수 있습니다.
분류 모델
은 고양이, 개, 물고기, 사기 등의 범주형 출력을 반환하는 모델입니다. 분류 모델에
서 여러분은 구분하려는 범주에 무엇이 있는지를 미리 알아야 합니다. 범주는 숫자가 될 수도
있습니다. 가령 등급이나 범주 레이블 대신 숫자 레이블을 사용할 수 있습니다. 이 장에서 다루
는 문제에서의 범주란, 합법적인 거래와 사기 거래를 나타내는
0
과
1
이 됩니다.
분류 모델이 반환하는 예측 결과는 특정 범주가 아니라, 가능한 모든 범주에 대한 확률입니다.
그리고 그중 가장 확률이 높은 범주를 예측 결과라고 추출하는 것이 일반적입니다. 하지만 범
주가 두 개뿐인 이진 분류에서는 그렇지 않을 수 있습니다. 가령 거래가 사기일 확률이
50
% 이
상인 경우에만 거래를 사기 거래로 분류한다고 가정해 보겠습니다. 그러면 너무 많은 사기 거
래를 놓칠 수 있습니다. 반면, 임곗값을
5
%로 너무 낮게 설정하면 너무 많은 거래가 사기 거래
로 분류되어, 이들을 조사하는 데 너무 많은 자원을 소비해야 할 수도 있습니다.
임곗값
설정은
모델링 문제이자 비즈니스 문제입니다.
임곗값은 다양한 평가 지표를 활용하여 비즈니스 요구 사항에 따라 결정할 수 있습니다. 정확 ...