
110
1
부
머신러닝
"
passthrough
"
를) 지정할 수 있습니다.
54
사이킷런
0
.
19
나 그 이전 버전을 사용한다면
sklearn
-
pandas
와 같은 서드파티
third
-
party
라이
브러리를 사용할 수 있습니다. 또는
ColumnTransformer
와 동일한 기능을 가진 사용자 정의
변환기를 만들 수 있습니다. 또는 여러 변환기를 적용하고 결과를 합쳐주는
FeatureUnion
클
래스를 사용할 수 있습니다. 하지만 각 변환기에 열을 따로 지정할 수 없고 전체 데이터에 모두
적용됩니다. 이 문제를 해결하기 위해 열을 선택해주는 사용자 정의 변환기를 만들 수 있습니
다(주피터 노트북의 예제를 참고하세요 ).
2.6
모델 선택과 훈련
드디어 마지막입니다! 문제를 정의한 후 데이터를 읽어 들이고 탐색했습니다. 그리고 훈련 세
트와 테스트 세트로 나누고 머신러닝 알고리즘에 주입할 데이터를 자동으로 정제하고 준비하
기 위해 변환 파이프라인을 작성했습니다. 이제 머신러닝 모델을 선택하고 훈련시킬 준비가 되
었습니다.
2.6.1
훈련 세트에서 훈련하고 평가하기
이전 단계의 작업 덕분에 생각보다 훨씬 간단해졌습니다. 먼저 앞 장에서 했던 것처럼 선형 회
귀 모델을 훈련시켜보겠습니다.
from sklearn.linear_model import LinearRegression
lin_reg ...