
351
7
장
실험 분석
7.1
SQL
을 활용한 실험 분석
SQL
은 실험 분석에 유용합니다. 대부분의 실험 분석에서 실험 코호트 데이터와 행동 데이터가
이미 데이터베이스에 저장돼 있으므로 자연스럽게
SQL
을 사용하게 됩니다. 성공 지표로는 이
미 조직에서 내부적으로 보고 및 분석하고 있는 지표를 그대로 활용하는 경우가 많으며, 이를
위한
SQL
쿼리도 이미 작성돼 있을 가능성이 높습니다. 실험을 위한 집단 구분 정보를 기존의
쿼리 로직에 추가하기는 그리 어렵지 않습니다.
SQL
은 실험 결과 보고를 자동화하는 데도 유용합니다. 동일한 쿼리에서 실험마다
WHERE
절
변수 이름만 조금씩 바꿔가면서 실행해보고 결과를 확인합니다. 수많은 실험을 반복하는 조직
이라면 결과를 빠르게 확인하고 해석하기 위해 이미 표준화된 보고 양식을 갖춘 경우가 많습니다.
SQL
은 실험 분석의 여러 단계에서 유용한 반면에 통계적 유의성을 계산할 수 없다는 큰 단점
이 있습니다. 많은 데이터베이스에서는 사용자 정의 함수
user
-
defined
function
(
UDF
)를 지원해 개
발자가 직접
SQL
의 기능을 확장해 사용하도록 합니다. 사용자 정의 함수를 사용해 파이썬과
같은 프로그래밍 언어의 통계 테스트를 활용할 수 있지만, 이는 책에서 다루는 범위를 넘어서
므로 따로 다루지 않습니다. 다른 ...