
176
머신러닝 인터뷰 실무 가이드
이 장에서는 머신러닝 모델 학습 과정과 관련된 인터뷰 문제들을 다룰 것입니다. 많은 실무
자에게 모델 학습은 가장 재미있는 부분이며, 저 역시 그렇게 생각합니다. 학습 과정을 통해
모델이 점점 더 정확해지는 것을 보는 건 매우 즐겁습니다. 그러나, 머신러닝 모델 학습, 하
이퍼파라미터 튜닝
hyperparameter
tuning
, 다양한 알고리즘을 사용한 실험을 진행하는 것 모두 데이
터를 필요로 합니다. 머신러닝의 핵심은 알고리즘이 데이터에서 패턴을 찾고, 그 패턴을 바
탕으로 예측 및 결정을 내리게 하는 것입니다. 유용한 데이터는 머신러닝의 토대이며, 업계
속담 그대로 “쓰레기를 입력하면 쓰레기가 출력된다”입니다. 즉, 머신러닝 모델이 쓸모없는
데이터로 학습되면, 학습 결과로 만들어지는 모델과 이를 통한 추론도 쓸모없게 됩니다.
이 장에서 저는 원시 데이터를 머신러닝 알고리즘에 유용한 (그리고 호환 가능한 ) 형식으로
변환하는 데이터 프로세싱 및 정제에 대한 개요를 살펴보는 것부터 시작합니다. ...