
244
로우코드 AI
import joblib
joblib.dump(cls, 'filename.joblib')
cls = joblib.load('filename.joblib')
이는 모델뿐만 아니라 사용 중인 변환기 및 기타 객체에도 적용될 수 있습니다.
7.4.5
사이킷런의 파이프라인
이 절은 사이킷런의 파이프라인이라는 고급 주제를 자세히 다룹니다. 처음 읽을 때는 그냥 넘
어가도 좋지만, 나중에 다시 읽어서 사이킷런으로 변환기를 관리하는 방법을 배워보기 바랍니다.
다양한 변환을 단일 함수로 결합하는 과정은 다소 지루할 수 있습니다. 그러나 이는 학습-서빙
왜곡이라는 문제를 방지하는 데 매우 중요한 과정입니다. 한편, 사이킷런은 파이프라인(
Pipe-
line
)이라는 자료 구조를 제공하여, 이 과정을 간소화합니다. 파이프라인은 최종 객체인 모델
(예:
LinearRegression
)을 제외한
OneHot
Encoder
와 같은 모든 변환용 객체와 이들의 순서
정보를 포함합니다.
그런데 사이킷런의 변환기를 사용하지 않고 판다스의 데이터프레임을 직접 조작하는 작업이
존재합니다. 이 작업을 어떻게 사이킷런의 파이프라인에 포함할까요? 사이킷런의
Function-
Transformer
를 사용하면 됩니다.
FunctionTransformer
는 파이썬 함수를 파라미터로 입력받