
321
9
장
연속 학습과 프로덕션 테스트
CHAPTER
9
연속 학습과 프로덕션 테스트
8
장에서는
ML
시스템이 프로덕션에서 실패하는 다양한 사례와 원인을 논의했습니다. 특히 데
이터 분포 시프트에 초점을 맞췄는데, 이는 연구자와 실무자 모두에게 많은 논의를 불러일으킨
까다로운 문제입니다. 이어서 데이터 분포 시프트를 감지하기 위한 여러 모니터링 기술과 도구
를 알아봤습니다.
이 장에서도 논의를 이어갑니다. 데이터 분포 시프트에 모델을 적응시키려면 어떻게 해야 할까
요? 답은
ML
모델을 지속적으로 업데이트하는 것입니다. 이 장에서는 먼저 연속 학습이 무엇
이며 어떤 난제가 있는지 알아봅니다 (스포일러: 연속 학습은 주로 인프라 문제입니다 ). 그리
고 연속 학습을 현실화하기 위한
4
단계 계획을 세웁니다.
이어서 모델을 얼마나 자주 재훈련해야 하는지 알아봅니다. 모델을 원하는 만큼 자주 업데이트
하도록 인프라를 설정한 후에는 재훈련 빈도를 고려해야 합니다. 재훈련 빈도는 필자가 지금까
지 만난
ML
엔지니어 중 대다수가 질문했던 주제이기도 합니다.
모델이 변화하는 환경에 적응하도록 재훈련했다면, 이를 고정 테스트 세트에서 평가하는 것만
으로는 충분하지 않습니다. 따라서 어렵지만 꼭 필요한 개념인 프로덕션 테스트를 다룹니다.
이 프로세스는 프로덕션에서 라이브 데이터로 시스템을 ...