
758
2
부
신경망과 딥러닝
18.12
TF
-
Agents
라이브러리
TF
-
Agents
라이브러리 (
https
://
github
.
com
/
tensorflow
/
agents
)는 구글에서 개발하여
2018
년에 오픈 소스로 공개한 텐서플로 기반의 강화 학습 라이브러리입니다.
OpenAI
짐과
마찬가지로 많은 환경을 내장하고 있습니다 (
OpenAI
짐 환경을 감싼 것도 있습니다 ). 또한
(
3D
물리 시뮬레이션을 위해 )
PyBullet
라이브러리, (
MuJoCo
의 물리 엔진을 기반으로 한)
딥마인드의
DM
Control
라이브러리, (여러
3D
환경을 시뮬레이션하는 )
ML
-
Agents
라이
브러리도 지원합니다. 또한
REINFORCE
,
DQN
,
DDQN
는 물론 효율적인 재생 버퍼와 측정
지표 같은 다양한 강화 학습 컴포넌트 구현을 제공합니다. 빠르고 확장성이 좋고 사용하기 쉬
우며 커스터마이징이 가능합니다. 자신만의 환경과 신경망을 만들 수 있고 어떤 컴포넌트도 상
당한 수준까지 커스터마이징할 수 있습니다. 이 절에서
TF
-
Agents
를 사용해 유명한 아타리
게임인 <브레이크아웃> (그림
18
-
11
)
39
을 플레이하는 에이전트를
DQN
알고리즘으로 훈련
하겠습니다 (필요하면 다른 알고리즘으로 쉽게 바꿀 수 있습니다 ).
그림
18-11
게임 <브레이크아웃>
18.12.1 ...