
768
2
부
신경망과 딥러닝
층은 활성화 함수를 사용하지 않습니다.
내부적으로
QNetwork
는 두 부분으로 구성됩니다. 관측을 처리하는 인코딩 네트워크와 그 뒤
에 행동마다
Q
-가치를 출력하는 밀집 출력층입니다.
TF
-
Agents
의
EncodingNetwork
클래
스는 여러 가지 에이전트에서 찾을 수 있는 신경망 구조를 구현합니다 (그림
18
-
14
).
입력이 하나 이상일 수 있습니다. 예를 들어 관측이 센서 데이터와 카메라 이미지로 구성된다
면 입력이 두 개가 됩니다. 각 입력마다 전처리 단계가 필요할 수 있습니다. 이런 경우 입력마
다 하나의 전처리 층을 만들어
preprocessing
_
layers
매개변수에 케라스 층의 리스트를 전
달할 수 있습니다. 네트워크는 각 층을 이에 대응되는 입력에 적용할 것입니다(여러 전처리 층
이 필요한 입력의 경우 모델 전체를 전달할 수 있습니다. 케라스 모델은 언제든지 층으로 사용
될 수 있습니다 ). 두 개 이상의 입력이 있다면
preprocessing
_
combiner
매개변수에 전처리
층의 출력을 하나의 출력으로 묶는 층을 추가로 전달해야 합니다.
그다음 인코딩 네트워크는
conv
_
layer
_
params
매개변수에 지정한 합성곱 층의 리스트를 순
서대로 적용할 것입니다. 이 매개변수는 원소를
3
개 갖는 튜플로 구성된 리스트입니다 ...