
375
8
장
복잡한 데이터셋 생성
3
장부터
7
장까지는
SQL
을 활용한 데이터 분석 방법을 알아봤습니다. 이외에 다양한 추가 분
석을 위한 범용 데이터셋을 생성하는 데도
SQL
을 활용합니다. 예를 들어,
SQL
을 활용해 데이
터베이스의 테이블, 텍스트 파일 또는
BI
도구에서 사용할 수 있는 파일을 생성합니다. 간단한
SQL
코드로 단순히 몇 개의 필터링 또는 집계만을 수행하는 경우도 있지만, 원하는 데이터셋
을 생성하려면 매우 복잡한 코드와 로직이 필요한 경우도 있습니다. 게다가 이해관계자가 추가
로 데이터 확인이나 계산을 요청하기 마련이므로, 이 복잡한 코드를 계속해서 유지보수해야 합
니다. 따라서 일회성이 아니라 지속적인 관리가 필요한
SQL
코드를 작성할 때는 코드의 구성,
성능, 유지보수를 매우 중요하게 고려해야 합니다.
먼저, 코드를 다른 사람과 공유하고 지속적으로 업데이트하기 쉽게끔 작성하는 원칙을 알아봅
니다. 그리고 언제
SQL
의 쿼리 로직을 유지해야 하며, 언제
ETL
extract
-
transform
-
load
을 통해 테
이블로 옮겨야 하는지 알아봅니다. 다음으로, 서브쿼리, 임시 테이블
temp
table
, 공통 테이블 표
현식 등 쿼리의 중간 결과를 저장하는 방법과 이를 사용할 때 고려할 사항을 알아봅니다. 마지
막으로, 데이터셋 크기를 줄이는 방법과 ...