
433
11
장
심층 신경망 훈련하기
은닉층 1 은닉층 1 은닉층 1 은닉층 1
은닉층 2 은닉층 2 은닉층 2
은닉층 3 은닉층 3
출력층
입력층 입력층 입력층 입력층
레이블되지 않은
데이터
레이블된
데이터
은닉층 1 훈련 은닉층 2 훈련 은닉층 3 훈련 출력층 훈련
비지도 학습(예: 오토인코더) 지도 학습(역전파 알고리즘)
상위층 상세 튜닝
그림
11-5
비지도 훈련에서는 비지도 학습 기법으로 레이블이 없는 데이터(또는 전체 데이터)로 모델을 훈련합니다. 그
다음 지도 학습 기법을 사용하여 레이블된 데이터에서 최종 학습을 위해 세밀하게 튜닝합니다. 비지도 학습 부분은 그
림
처럼 한 번에 하나의 층씩 훈련하거나 바로 전체 모델을 훈련할 수도 있습니다.
11.2.3
보조 작업에서 사전훈련
레이블된 훈련 데이터가 많지 않다면 마지막 선택 사항은 레이블된 훈련 데이터를 쉽게 얻거나
생성할 수 있는 보조 작업에서 첫 번째 신경망을 훈련하는 것입니다. 그리고 이 신경망의 하위
층을 실제 작업을 위해 재사용합니다. 첫 번째 신경망의 하위층은 두 번째 신경망에 재사용될
수 있는 특성 추출기를 학습하게 됩니다.
예를 들어 얼굴을 인식하는 시스템을 만들려고 하는데 개인별 이미지가 얼마 없다면 좋은 분류
기를 훈련하기에 충분하지 않습니다. 각 사람의 사진을 수백 개씩 모으기는 현실적으로 어렵습 ...