
370
4
부
강화 학습과 자연어 처리
매우 중요하다. 해석 가능성을 위해 훈련 알고리즘의 훈련 에피소드 플롯을 사용했으며 모
델이 일정 기간에 훈련을 시작하고 전략을 발견하며 이를 활용하기 시작한다는 것을 발견했
다. 실시간 거래를 위해 모델을 배포하기 전에 서로 다른 기간에 충분한 횟수의 테스트를 수
행해야 한다.
강화 학습 기반 모델을 사용하는 동안 보상 함수 및 상태와 같은 강화 학습 구성요소를 신중
하게 선택하고 전체 모델 결과에 미치는 영향을 이해해야 한다. 모델을 구현하거나 훈련하
기 전에 ‘강화 학습 알고리즘이 올바른 메트릭을 최적화하는 방법을 배울 수 있도록 보상 함
수 또는 상태를 어떻게 엔지니어링할 수 있을까?’ 같은 질문에 대해 생각해 보는 것 역시 중
요하다.
전반적으로 이러한 강화 학습 기반 모델을 사용하면 재무 실무자가 매우 유연한 접근법으로
거래 전략을 만들 수 있다. 이 실전 문제에서 제공하는 프레임워크는 알고리즘 거래에 사용
할 강력한 모델을 개발하는 데 좋은 출발점이 될 것이다.
9.3
실전 문제
2
: 파생상품 헤징
파생 상품 가격 책정 및 위험 관리를 다루는 전통적인 금융 이론은 대부분 거래 제한, 거래 비
용, 시장 영향, 유동성 제약 등이 없이 완벽한 헤지가 가능하다는 이상적인 시장 가정에 기반한
다. 그러나 실제로 거래 제한, 거래 ...