
171
3
장
분류
클래스의 점수로 계산합니다. 그러므로 몇 개의 픽셀만 다른
3
과
5
를 모델이 쉽게 혼동하게 됩
니다.
3
과
5
의 주요 차이는 위쪽 선과 아래쪽 호를 이어주는 작은 직선의 위치입니다. 숫자
3
을 쓸
때 연결 부위가 조금 왼쪽으로 치우치면 분류기가
5
로 분류하고 그 반대도 마찬가지입니다. 다
른 말로 하면 분류기는 이미지의 위치나 회전 방향에 매우 민감합니다.
3
과
5
의 오류를 줄이는
한 가지 방법은 이미지를 중앙에 위치시키고 회전되어 있지 않도록 전처리하는 것입니다. 하지
만 각 이미지에 대해 정확한 회전을 예측해야 하므로 쉽지 않을 수 있습니다. 이보다 훨씬 간단
한 접근 방식은 훈련 이미지를 약간 이동시키거나 회전된 변형 이미지로 훈련 집합을 보강하는
것입니다. 이렇게 하면 모델이 이러한 변형에 더 잘 견디도록 학습하게 됩니다. 이를
데이터 증
식
data
augmentation
이라고 합니다 (
14
장에서 다루겠습니다. 이 장의 마지막에 있는 연습문제
2
번도
참고하세요 ).
3.6
다중 레이블 분류
지금까지는 각 샘플이 하나의 클래스에만 할당되었습니다. 하지만 분류기가 샘플마다 여러 개
의 클래스를 출력해야 할 때도 있습니다. 얼굴 인식 분류기를 생각해봅시다. 같은 사진에 여러
사람이 등장한다면 어떻게 해야 할까요? 인식된 사람마다 하나씩 꼬리표 ...