
157
4
장
모델 훈련
지금까지는 머신러닝 모델과 훈련 알고리즘을 블랙박스처럼 취급했습니다. 앞 장의 연습문제
를 풀어봤다면 내부가 어떻게 작동하는지 몰라도 많은 일을 처리할 수 있다는 점에 놀랐을 것입
니다. 회귀 시스템을 최적화하고 숫자 이미지 분류기를 개선했으며 스팸 분류기를 처음부터 구
축했지만 실제로 어떻게 작동하는지는 모릅니다. 많은 경우 구현의 상세 사항을 실제로 알아야
할 필요는 없습니다.
하지만 어떻게 작동하는지 잘 이해하고 있으면 적절한 모델, 올바른 훈련 알고리즘, 작업에 맞는
좋은 하이퍼파라미터를 빠르게 찾을 수 있습니다. 작동 원리를 이해하고 있으면 디버깅이나 에
러를 효율적으로 분석하는 데 도움이 됩니다. 이 장에서 언급하는 대부분의 주제는 신경망
neural
network
(
2
부에서 설명합니다 )을 이해하고 구축하고 훈련시키는 데 필수입니다.
이 장에서는 가장 간단한 모델 중 하나인 선형 회귀부터 시작합니다. 이 모델을 훈련시키는 두
가지 방법을 설명하겠습니다.
●
직접 계산할 수 있는 공식을 사용하여 훈련 세트에 가장 잘 맞는 모델 파라미터 (즉, 훈련 세트에 대해 비
용 함수를 최소화하는 모델 파라미터)를 해석적으로 구합니다.
●
경사 하강법 (
GD
)이라 불리는 반복적인 최적화 방식을 사용하여 모델 파라미터를 조금씩 바꾸면서 비용 ...