
235
7
장
파이썬으로 사용자 정의 ML 모델 학습시키기
다. 손실 함수를 계산할 때, 앞의 마이너스 기호 때문에 부호는 양수로 바뀌게 됩니다. 그러나
라면,
log
(
0
.
4
)는 약 -
0
.
398
이며, 이 경우 예측 확률
가
1
에서 멀어질수록
손실 함수에 대한 기여도는 커집니다.
NOTE
교차 엔트로피는
정보 이론
이라는 학문 분야에서 처음 등장한 개념으로, 하나의 확률 분포를
가정했을 때 특정 사건을 표현하는 데 필요한 정보의 양을 측정하지만, 실제 확률 분포는 다릅니다. 로지
스틱 회귀는 가정된 확률 분포는 모델의 출력에서 나왔으며, 실제 분포는 레이블을 통해 제공됩니다.
7.4.2
사이킷런을 사용한 모델 학습 및 평가
데이터를 준비하고 고객 이탈을 예측하기 위해 학습시킬 모델 유형으로 로지스틱 회귀를 선택
했습니다. 이제 사이킷런으로 첫 번째 모델을 학습시킬 준비가 되었습니다. 사이킷런에서 모델
을 생성하고 학습시키는 과정은 매우 간단합니다. 먼저 원하는 유형의 모델을 만든 다음에 모
델을 학습시키면 됩니다. 다음 코드는 로지스틱 회귀 모델을 구축하고 학습시키는 방법을 보여
줍니다.
from sklearn.linear_model import LogisticRegression
cls = LogisticRegression()
cls.fit(X_train, ...