
214
1
부
머신러닝
gamma
(
γ
)와
C
를 바꾸어서 훈련시킨 모델입니다.
gamma
를 증가시키면 종 모양 그래프가 좁아
져서 ([그림
5
-
8
]의 왼쪽 그래프를 참고하세요 ) 각 샘플의 영향 범위가 작아집니다. 결정 경계
가 조금 더 불규칙해지고 각 샘플을 따라 구불구불하게 휘어집니다. 반대로 작은
gamma
값은 넓
은 종 모양 그래프를 만들며 샘플이 넓은 범위에 걸쳐 영향을 주므로 결정 경계가 더 부드러워집
니다. 결국 하이퍼파라미터
γ
가 규제의 역할을 합니다. 모델이 과대적합일 경우엔 감소시켜야
하고 과소적합일 경우엔 증가시켜야 합니다 (하이퍼파라미터
C
와 비슷합니다
10
).
그림
5-9
RBF
커널을 사용한
SVM
분류기
다른 커널도 있지만 거의 사용되지 않습니다. 어떤 커널은 특정 데이터 구조에 특화되어 있습
니다.
문자열 커널
string
kernel
이 가끔 텍스트 문서나
DNA
서열을 분류할 때 사용됩니다 (예를
들면
문자열 서브시퀀스 커널
string
subsequence
kernel
이나
레벤슈타인 거리
Levenshtein
distance
기반의 커
널).
11
10
옮긴이_ 따라서 모델의 복잡도를 조절하려면
gamma
와
C
하이퍼파라미터를 함께 조정하는 것이 좋습니다.
11
옮긴이_ 문자열 커널은 두 문자열의 유사도를 비교하는 함수로 생각할 수 있습니다. ...