
113
3
장
시계열 분석
3.3
데이터 트렌드 분석
시계열 데이터에서 데이터의 트렌드를 분석해보고 싶은 경우가 있습니다. 여기서 트렌드란 데
이터가 움직이는 방향을 의미합니다. 값은 시간에 따라 증가하기도 하고 감소하기도 합니다.
또한 변화의 기울기가 더 평평해지기도 하고 덜 평평해지기도 하며, 오르락내리락 불규칙적으
로 움직일 수도 있습니다. 따라서 트렌드를 파악하는 일은 쉽지 않습니다. 이 절에서는 그래프
를 이용한 간단한 트렌드 분석, 각 요소가 전체에서 차지하는 비율을 이용한 요소별 트렌드 비
교 분석, 시간 윈도우 기반의 트렌드 분석 등 여러 가지 시계열 분석 기법을 알아봅니다.
3.3.1
간단한 트렌드
트렌드 분석은 데이터 프로파일링 수단일 수도 있고, 트렌드 파악 자체가 목적일 수도 있습니
다. 트렌드 분석에서 결과 데이터는 날짜 또는 타임스탬프와 이에 해당하는 수치값으로 이뤄져
있습니다. 시계열 데이터로 그래프를 그릴 때 날짜 또는 타임스탬프는
X
축에 놓이며, 수치값은
Y
축에 놓입니다. 예를 들어, 다음 코드와 같이 미국 전체 소매업과 외식업의 매출 트렌드를 검
토해봅시다.
SELECT
sales_month
,sales
FROM
retail_sales
WHERE
kind_of_business = ‘Retail and food services sales, ...