
177
4
장
모델 훈련
지금까지는 머신러닝 모델과 훈련 알고리즘을 블랙박스처럼 취급했습니다. 앞 장의 연습문제
를 풀어봤다면 내부 작동 방식을 몰라도 많은 일을 처리할 수 있다는 점에 놀랐을 것입니다. 회
귀 시스템을 최적화하고 숫자 이미지 분류기를 개선했으며 스팸 분류기를 처음부터 구축했지만
실제로 어떻게 작동하는지는 모릅니다. 많은 경우 구현의 세부 사항을 실제로 알아야 할 필요
는 없습니다.
하지만 어떻게 작동하는지 잘 이해하고 있으면 적절한 모델, 올바른 훈련 알고리즘, 작업에 맞는
좋은 하이퍼파라미터를 빠르게 찾을 수 있습니다. 또한 디버깅이나 에러를 효율적으로 분석하는
데 도움이 됩니다. 이 장에서 언급하는 대부분의 주제는 신경망 (
2
부에서 설명합니다 )을 이해
하고 구축하고 훈련시키는 데 필수입니다.
이 장에서는 가장 간단한 모델인 선형 회귀부터 시작합니다. 이 모델을 훈련시키는 두 가지 방
법을 설명하겠습니다.
●
닫힌 형태의 방정식
closed
-
form
equation
1
을 사용하여 훈련 세트에 가장 잘 맞는 모델 파라미터 (즉, 훈련 세
트에 대해 비용 함수를 최소화하는 모델 파라미터)를 직접 계산합니다.
●
경사 하강법
gradient
descent
(
GD
)이라 불리는 반복적인 최적화 방식을 사용하여 모델 파라미터를 조금씩
바꾸면서 비용 함수를 ...