
111
3
장
시계열 분석
의 출처가 다른 경우가 있습니다. 이 경우, 사용자의 기기에 저장된 타임스탬프를 서버로 전송
하는 경우에 시간 동기화 문제가 발생할 수 있습니다. 한번은 스마트폰에서 사용자의 액션을
기록한 시간과 서버에서 기록한 시간 사이에 몇 분씩 차이가 발생해 실험 결과가 잘못 계산된
적이 있습니다. 사용자의 타임스탬프 시간이 서버의 시간보다 몇 분 빨라서 일부 이벤트 데이
터가 분석에 포함되지 않았던 것입니다. 이런 문제를 해결하는 방법은 간단합니다. 우선 서버
의 타임스탬프와 사용자의 타임스탬프 값이 다른 데이터를 찾습니다. 만약 두 타임스탬프의 시
간 차이가 특정 값보다 크다면 데이터를 삭제하고, 특정 값보다 작다면 데이터를 버리지 않고
보정해 남겨둘 수 있습니다. 이때
BETWEEN
절과 앞 절에서 설명한 날짜 계산을 활용합니다.
모바일 앱의 데이터를 다룰 때, 모바일에서의 특정 액션 로그 데이터가 스마트폰 시간으로 기
록되는지 혹은 서버의 데이터베이스에 도착한 시간으로 기록되는지 잘 파악해야 합니다. 시간
차이는 무시해도 될 정도로 작기도 하고, 하루 이상이 되기도 합니다. 이렇게 차이가 나는 원인
은 모바일 앱이 오프라인 모드로도 동작하는지 여부, 인터넷 신호가 약할 때 데이터를 서버로
전송하는 방법 등 다양합니다. 모바일 앱의 데이터가 ...