873
부록 A
연습문제 정답
17
장
:
오토인코더와
GAN
을 사용한 표현 학습과 생성적 학습
1
.
오토인코더를 활용할 수 있는 주요 작업은 다음과 같습니다.
•
특성 추출
•
비지도 사전훈련
•
차원 축소
•
생성 모델
•
이상치 탐지(일반적으로 오토인코더는 이상치를 재구성하는 일은 잘하지 못합니다)
2
.
레이블되지 않은 훈련 데이터는 많지만, 레이블된 데이터는 수천 개 정도만 가지고 있을
때 분류기를 훈련시키려면 전체 데이터셋 (레이블된 것 + 레이블되지 않은 것 )에 먼저 심
층 오토인코더를 훈련시킨 다음 하위층 절반 (즉, 코딩 층과 그 하위층들 )을 재사용합니
다. 그리고 레이블된 데이터를 사용해 분류기를 훈련시킵니다. 레이블된 데이터가 조금밖
에 없다면 분류기를 훈련시킬 때 재사용된 층을 동결하는 것이 좋습니다.
3
.
어떤 오토인코더가 입력을 완벽하게 재구성한다는 사실이 반드시 좋은 오토인코더임을 의
미하는 것은 아닙니다. 아마도 입력을 코딩 층과 출력으로 복사하는 것을 배운 과대완전
오토인코더일지 모릅니다. 사실 코딩 층의 뉴런이 한 개여도 매우 깊은 오토인코더는 모든
훈련 샘플을 다른 코딩으로 매핑하는 것이 가능합니다 (예를 들어 첫 번째 샘플은
0
.
001
에, 두 번째 샘플은
0
.
002
에, 세 번째 샘플은
0
.
003
에 매핑되는 식입니다). 그리고 각 코
딩에 대한 정확한 훈련 샘플을 재구성하는 것을 외워서 학습할 수 있습니다. 데이터에 있는
어떤 유용한 패턴을 실제 학습하지 않고 입력을 완벽히 재구성합니다. ...