255
9
장
배포 방식 선택
9.4
마치며
머신러닝 기반 애플리케이션을 제공하는 방법은 여러 가지입니다. 스트리밍
API
로 모델이 도
착하는 대로 샘플을 처리할 수 있습니다. 배치 워크플로를 사용해 정기적인 스케줄에 따라 한
번에 여러 데이터 샘플을 처리할 수 있습니다. 또는 모델을 애플리케이션에 패키징하거나 웹
브라우저를 통해 제공하는 방식으로 클라이언트 측에 배포할 수도 있습니다. 이렇게 하면 추론
비용과 인프라 요구 사항을 낮출 수 있지만 배포 과정은 더 복잡해집니다.
최선의 방법은 속도, 하드웨어, 네트워크, 개인 정보 보호, 추론 비용과 같은 애플리케이션의
요구 사항에 따라 다릅니다. 머신러닝 에디터와 같이 간단한 프로토타입의 경우 엔드포인트나
간단한 배치 워크플로로 시작하여 반복할 수 있습니다.
모델 배포는 단순히 사용자에게 모델을 노출하는 것 이상입니다.
10
장에서 오류를 줄이기 위
한 모델의 안전장치와 효율적인 배포 과정을 위한 엔지니어링 도구를 만드는 방법, 모델이 올
바르게 수행되고 있는지 검증하는 방법을 다루겠습니다.