31
1
장
머신러닝에서 데이터로 의사 결정을 내리는 방법
1.2.9
모델 배포(서빙)
ML
모델의 학습, 평가, 테스트가 끝나면 실제 상용 환경에 배포할 수 있습니다. 또한, 이 단계
에 도달했다는 것은
API
를 통해 프로덕션 시스템과 통신하는 웹 앱 프런트엔드(브라우저 사
용)도 준비되었음을 의미합니다. 데이터를 실시간으로 수집하여
MLOps
파이프라인으로 스트
리밍하거나, 데이터를 배치로 수집하여 파이프라인에 저장할 수 있습니다. 이 두 방법을 모두
사용할 수도 있습니다.
1.2.10
모델 유지 관리
모델 예측이 원래 비즈니스 목표나 사용 사례의 지표와 일치하지 않는다면, 모델의 성능이 저
하될 수 있습니다. 세상이 변하거나 비즈니스 요구 사항이 변경되면 성능 저하가 발생할 수 있
다는 것이죠. 따라서 배포했다고 끝나는 것이 아니라, 예상대로 작동하는지를 지속적으로 모니
터링해야만 합니다. 정기적인 재학습으로 모델과 데이터의 변화, 즉
드리프트
drift
를 완화할 만반
의 준비가 필요합니다. 여기서 데이터 드리프트란, 학습에 사용된 데이터와 현재 웹 앱에서 수
집되는 데이터 사이의 차이를 만들어내는 변화를 의미합니다. 데이터 드리프트의 예시를 하나
살펴보겠습니다.
우산 비즈니스의 예시에서, 한때 비가 많이 오던 지역이 지금은 가뭄을 겪거나, 한때 가뭄이 심
했던 지역에 지금은 비가 많이 온다고 가정해 보죠. 날씨와 기후 예측이 변화하면, 우산의 필요
성과 고객이 선호하는 우산 종류도 영향을 받습니다. 이 경우 신규 데이터로 모델을 재학습시
키고, ...