
95
3
장
시계열 분석
지금까지
SQL
, 데이터베이스, 데이터 준비의 주요 단계를 알아봤으니 이제
SQL
을 활용해 특
정 타입의 데이터를 분석해볼 차례입니다. 이 세상에는 셀 수 없이 많은 데이터셋이 존재하며
분석 방법도 무궁무진합니다. 이번 장부터는 여러분의 분석 능력과
SQL
활용 능력을 향상하는
데 도움이 될 만한 다양한 유형의 분석을 살펴봅니다. 분석에 활용할 기법은 대부분
2
장에서
다룬 내용입니다. 먼저, 매우 중요하면서도 잘 알려진 시계열 데이터 분석을 알아봅시다.
시계열 분석은
SQL
로 수행 가능한 다양한 분석 중 하나입니다.
시계열
time
series
은 시간 순으로
재정렬된 데이터의 배열을 의미하며, 데이터는 주로 일정한 시간 간격을 두고 저장돼 있습니
다. 우리는 일상에서도 일일 최고 기온, 일일
S
&
P
500
장 마감 지수, 스마트 워치에 기록된 일
일 걸음 수 등 시계열 데이터를 쉽게 찾아볼 수 있습니다. 시계열 분석은 통계, 공학뿐 아니라
일기 예보, 업무 기획 등 다양한 학계 및 산업계에서 쓰입니다. 시계열 분석을 통해 시간에 따
른 데이터 변화를 이해하고 정량화합니다.
예측은 시계열 분석의 주요 목표 중 하나입니다. 시간은 앞으로 흐르므로 과거의 값으로 미래
의 값을 예측하는데, 시장 상황과 대중 트렌드, 제품 도입 시기 등이 수없이 ...