
402
2
부
신경망과 딥러닝
을 제한하기 위해 각 하이퍼파라미터에 어떤 값이 적절한지 생각해보는 것이 도움이 됩니다.
다음 절에서 퍼셉트론에 있는 은닉층의 개수와 뉴런의 개수를 고르고 주요 하이퍼파라미터에
서 좋은 값을 선택하는 가이드라인을 소개하겠습니다.
10.3.1
은닉층 개수
은닉층 하나로 시작해도 많은 문제에서 납득할 만한 결과를 얻을 수 있습니다. 이론적으로 은
닉층이 하나인 다층 퍼셉트론이더라도 뉴런 개수가 충분하면 아주 복잡한 함수도 모델링할 수
있습니다.
63
하지만 복잡한 문제에서는 심층 신경망이 얕은 신경망보다
파라미터 효율성
parameter
efficiency
이 훨씬 좋습니다. 심층 신경망은 복잡한 함수를 모델링하는 데 얕은 신경망보다 훨씬
적은 수의 뉴런을 사용하므로 동일한 양의 훈련 데이터에서 더 높은 성능을 낼 수 있습니다.
왜 그런지 이해하기 위해 복사/붙여넣기 기능이 없는 드로잉 소프트웨어로 숲을 그려야 한다
고 가정해봅시다. 시간이 아주 많이 걸릴 것입니다. 나무, 가지, 잎을 하나하나 전부 그려야 하
니까요. 만약 잎 하나를 그려서 가지에 붙여넣고, 이 나뭇가지를 복사해 나무를 만들고, 나무를
복사해 숲을 만들 수 있다면 금세 일을 마칠 수 있을 겁니다. 실제 데이터는 이런 계층 구조를
가진 경우가 많으므로 심층 신경망은 이런 ...