
205
5
장
서포트 벡터 머신
서포트 벡터 머신
support
vector
machine
(
SVM
)은 매우 강력하고 선형이나 비선형 분류, 회귀, 이상치
탐색에도 사용할 수 있는 다목적 머신러닝 모델입니다. 머신러닝에서 가장 인기 있는 모델에 속
하고 머신러닝에 관심 있는 사람이라면 반드시 알고 있어야 하는 모델입니다.
SVM
은 특히 복
잡한 분류 문제에 잘 들어맞으며 작거나 중간 크기의 데이터셋에 적합합니다.
이 장에서는
SVM
의 핵심 개념을 설명하고 사용 방법과 작동 원리를 살펴보겠습니다.
5.1
선형
SVM
분류
SVM
의 기본 아이디어는 그림으로 설명하는 것이 가장 좋습니다. [그림
5
-
1
]에
4
장 끝에서 소
개한 붓꽃 데이터셋의 일부를 나타냈습니다. 두 클래스가 직선으로 확실히 잘 나뉘어 있습니
다(
선형적으로 구분
됩니다 ). 왼쪽 그래프에 세 개의 선형 분류기에서 만들어진 결정 경계가 보
입니다.
1
점선으로 나타난 결정 경계를 만든 모델은 클래스를 적절하게 분류하지 못하고 있습니
다. 다른 두 모델은 훈련 세트에 대해 완벽하게 동작합니다. 하지만 결정 경계가 샘플에 너무 가
까워 새로운 샘플에 대해서는 아마 잘 작동하지 못할 것입니다. 오른쪽 그래프에 있는 실선은
SVM
분류기의 결정 경계입니다. 이 직선은 두 개의 클래스를 나누고 있을 뿐만 아니라 제일
가까운 ...