
368
4
부
강화 학습과 자연어 처리
6.
데이터 테스트
데이터를 훈련한 후 테스트 데이터셋에서 모델을 평가한다. 이 단계는 강화 학습에 특히 중
요하다. 에이전트가 보상을 데이터의 가짜 특성과 잘못 연관시키거나 특정 차트 패턴에 과
적합할 수 있다. 테스트 단계에서는 테스트 데이터에 대한 훈련 단계에서 이미 훈련된 모델
(
model
_
ep10
)의 성능을 확인한다. 파이썬 코드는 이전에 본 훈련셋과 유사하다. 그러나
is
_
eval
를
true
로 설정하고 응답 버퍼 함수를 호출하지 않으며 학습이 없다. 결과를 살펴
보자.
# 에이전트는 앞선 훈련셋에 이미 정의되었음.
test_data = X_test
l_test = len(test_data) - 1
state = getState(test_data, 0, window_size + 1)
total_profit = 0
is_eval = True
done = False
states_sell_test = []
states_buy_test = []
model_name = “model_ep10”
agent = Agent(window_size, is_eval, model_name)
state = getState(data, 0, window_size + 1)
total_profit = 0
agent.inventory = []