means = np.log(dataset.loc[:”2018-02-01”, tickers].mean())
data = np.log(dataset.loc[:”2018-02-01”, tickers]).sub(means)
data.plot(title=’Stock Time Series for Cluster %d’ % clust)
plt.show()
위의 차트를 보면 주식 수가 적은 모든 군집에서 서로 다른 군집에 있는 주식이 유사하게 움
직임을 알 수 있는데, 이는 군집화 기술의 효과를 입증한다.
6.
주식 쌍 선택
군집이 생성되면 여러 공적분 기반 통계 기술을 군집 내의 주식에 적용해 쌍을 생성할 수 있
다. 둘 이상의 시계열이 고정되지 않고 함께 이동하는 경향이 있는 경우, 두 개의 시계열은
공적분된 것으로 간주한다.
3
시계열 간 공적분의 존재는
Augmented
Dickey
-
Fuller
테
3
자세한 내용은
5
장을 참조한다.
304
3
부
비지도 학습
스트
4
,
Johansen
테스트
5
등의 여러 통계 기술로 검증할 수 있다.
이 단계에서는 군집 내의
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.