
131
3
장
분류
from sklearn.linear_model import SGDClassifier
sgd_clf = SGDClassifier(random_state=42)
sgd_clf.fit(X_train, y_train_5)
TIP
SGDClassifier
는 훈련하는 데 무작위성을 사용합니다(그래서 이름에 ‘확률적’이 붙었습니다). 결과를 재현
하고 싶다면
random
_
state
매개변수를 지정해야 합니다.
이제 이 모델을 사용해 숫자
5
의 이미지를 감지해보겠습니다.
>>> sgd_clf.predict([some_digit])
array([ True])
분류기는 이 이미지가
5
를 나타낸다고 추측했습니다 (
True
). 이 경우엔 특별하게 정확히 맞춘
것 같습니다 ! 그럼 모델의 성능을 평가해봅시다.
3.3
성능 측정
분류기 평가는 회귀 모델보다 훨씬 어렵기 때문에 이 장에서는 이 주제에 많은 지면을 할애할 것
입니다. 사용할 수 있는 성능 지표가 많습니다. 커피 한 잔 더 하면서 여러 가지 새로운 개념과
용어를 배워보죠 !
3.3.1
교차 검증을 사용한 정확도 측정
2
장에서 한 것처럼 교차 검증은 모델을 평가하는 좋은 방법입니다.
교차 검증 구현
가끔 사이킷런이 제공하는 기능보다 교차 검증 과정을 더 많이 제어해야 할 필요가 있습니다. 이
때는 교차 검증 기능을 직접 ...