
153
3
장
분류
다중 레이블 분류기를 평가하는 방법은 많습니다. 적절한 지표는 프로젝트에 따라 다릅니다. 예
를 들어 각 레이블의
F
1
점수를 구하고 (또는 앞서 언급한 어떤 이진 분류 지표를 사용하여 ) 간
단하게 평균 점수를 계산합니다. 다음 코드는 모든 레이블에 대한
F
1
점수의 평균을 계산합니다.
>>> y_train_knn_pred = cross_val_predict(knn_clf, X_train, y_multilabel, cv=3)
>>> f1_score(y_multilabel, y_train_knn_pred, average="macro")
0.976410265560605
실제로는 아닐 수 있지만 이 코드는 모든 레이블의 가중치가 같다고 가정한 것입니다. 특히 앨
리스 사진이 밥이나 찰리 사진보다 훨씬 많다면 앨리스 사진에 대한 분류기의 점수에 더 높은 가
중치를 둘 것입니다. 간단한 방법은 레이블에 클래스의
지지도
support
(즉, 타깃 레이블에 속한
샘플 수 )를 가중치로 주는 것입니다. 이렇게 하려면 이전 코드에서
average
=
"
weighted
"
로
설정하면 됩니다.
18
3.7
다중 출력 분류
마지막으로 알아볼 분류 작업은
다중 출력 다중 클래스 분류
multioutput
-
multiclass
classification
(또는 간단
히
다중 출력 분류