
264
우아한 사이파이
8.6
게놈의 마르코프 모델
8
.
4
절 ‘커링 : 스트리밍의 묘미’에서 다룬 코드 예제로 다시 돌아간다. 마르코프 모델이란 무엇
이며 왜 유용한걸까?
일반적으로 마르코프 모델은 어떤 상태로 시스템이 옮겨질 확률은 현재 상태 의존하여 나타난
다고 가정한다. 예를 들어 오늘 날씨가 맑다면 내일도 맑을 확률이 높다. 어제 비가 내렸다는
사실은 상관없다. 마르코프 모델의 이론에서는 미래를 예측하는 데 필요한 모든 정보가 현재
상태로 인코딩된다. 과거와는 상관없다. 이 가정은 다루기 어려운 문제를 단순화하는 데 유용
하며 종종 좋은 결과를 가져온다. 한 예제로 마르코프 모델은 휴대 전화 및 위성 통신에서 대부
분의 신호처리를 담당한다.
게놈의 다른 기능 영역은 비슷한 상태 간에 다른 전이 확률을 갖는다. 새로운 게놈에서 이러한
전이 확률을 관찰하면 게놈의 영역 기능에 대해서 뭔가 예측할 수 있다. 다시 날씨로 돌아가보
자. 로스엔젤레스와 런던 어디에 있느냐에 따라서 화창하거나 비가 오는 확률이 매우 다르다.
만약 지역에 대한 날씨 정보 문자열(맑음, 맑음, 맑음, 맑음 ... )이 있다면 과거 모델을 바탕으
로 로스엔젤레스의 날씨인지 런던의 날씨인지 예측할 수 있다.
이번 절에서는 모델을 만드는 것에 대해서만 다룬다.
노랑초파리 게놈 파일
10
을 내려받자. ...