
145
3
장
분류
>>> roc_auc_score(y_train_5, y_scores_forest)
0.9983436731328145
정밀도와 재현율 점수를 계산하면
99
.
0
% 정밀도와
86
.
6
% 재현율이 나옵니다. 나쁘지 않군요!
이제 이진 분류기를 훈련시키는 방법과 작업에 맞는 적절한 지표 선택, 교차 검증을 사용한 평
가, 요구 사항에 맞는 정밀도/재현율 트레이드오프 선택,
ROC
곡선과
ROC
AUC
점수를 사용
한 여러 모델의 비교에 대해 알게 되었을 것입니다. 다음에는 숫자
5
이상을 감지해보겠습니다.
3.4
다중 분류
이진 분류가 두 개의 클래스를 구별하는 반면
다중 분류기
multiclass
classifier
(또는
다항 분류기
multinomial
classifier
)는 둘 이상의 클래스를 구별할 수 있습니다.
(
SGD
분류기, 랜덤 포레스트 분류기, 나이브 베이즈
naive
Bayes
분류기 같은) 일부 알고리즘은
여러 개의 클래스를 직접 처리할 수 있는 반면, (로지스틱 회귀나 서포트 벡터 머신 분류기 같
은) 다른 알고리즘은 이진 분류만 가능합니다. 하지만 이진 분류기를 여러 개 사용해 다중 클
래스를 분류하는 기법도 많습니다.
예를 들어 특정 숫자 하나만 구분하는 숫자별 이진 분류기
10
개(
0
에서 부터
9
까지 )를 훈련시
켜 클래스가
10
개인 숫자 ...