
301
CHAPTER 14
쿠버네티스에서 머신러닝 실행하기
프로세스는 그야말로 쿠버네티스의 모든 기능을 동시에 활용하는 과정으로, 이를 완수하려
면 스케줄링, 특수 하드웨어 액세스, 데이터셋 볼륨 관리, 스케일링, 네트워킹 등의 태스크가
원활하게 이루어져야 한다. 훈련 단계는 다음 절에서 더 자세히 이야기하겠다.
■제공
serving
훈련을 마친 모델이 클라이언트가 전달한 데이터를 기반으로 추론하기 위해 클라이언트로부
터 수신된 서비스 요청에 액세스하는 과정이다. 예를 들어, 개와 고양이를 감지하도록 훈련
된 이미지 인식 모델은 클라이언트가 개 사진을 제출하는 즉시 어느 정도 수준의 정확도로 그
것이 개인지 여부를 판단할 것이다.
14.3
쿠버네티스 클러스터 관리자가 고려해야 할 사항
쿠버네티스 클러스터에서 머신러닝 워크로드를 실행하려면 클러스터 관리자가 고민해야 할
문제들이 있다. 데이터 과학자 팀을 맡은 클러스터 관리자가 맞닥뜨릴 가장 큰 어려움은 일
단 낯선 용어부터 이해하는 것이겠지만, 이는 시간이 지나면서 점점 익숙해지므로 처음부터
너무 걱정할 필요는 없다.
14.3.1
모델 훈련
쿠버네티스에서 머신러닝 모델을 훈련시키려면
CPU
와
GPU
가 필요하다. 리소스를 더 많이
투입할수록 당연히 훈련도 더 빨리 끝난다. 모델 훈련은 필요한 리소스가 준비된 단일 머신 ...