Skip to Content
SQL로 시작하는 데이터 분석
book

SQL로 시작하는 데이터 분석

by 캐시 타니무라, 박상근
August 2022
Beginner to intermediate
436 pages
9h 43m
Korean
Hanbit Media, Inc.
Content preview from SQL로 시작하는 데이터 분석
425
9
결론
GROUP
BY
1,2
ORDER
BY
3
desc
;
위 쿼리에서는 두 제품을 한 그룹으로 구성해 함께 구매하는 제품 패턴을 파악했지만,
JOIN
더 추가하면 세 개 이상의 제품을 한 그룹으로 묶어볼 수도 있습니다.
장바구니 분석을 할 때 몇 가지 유의할 사항이 있습니다. 첫 번째는 성능입니다. 제품, 서비
스, 기능 등이 매우 다양한 경우 장바구니 분석 쿼리의 성능이 문제가 될 수 있습니다. 특히 세
개 이상의 제품으로 구성된 그룹을 찾아 함께 구매하는 패턴을 분석하려면 세 개 이상의
self
-
JOIN
이 필요하므로 데이터베이스에서 쿼리 실행 속도가 느려집니다. 이 문제를 해결하려면
WHERE
절을 사용해 자주 구매하지 않는 제품을 테이블에서 미리 제외하고
JOIN
을 수행하는 편
이 좋습니다. 두 번째 유의 사항으로, 몇몇 제품만 구매가 자주 일어나 제품 조합을 망치는 경
우가 있습니다. 예를 들어, 우유를 너무 자주 구매하면 함께 구매하는 제품 그룹 목록을 분석했
을 때 우유가 항상 최상위권에 나오게 됩니다. 쿼리가 정확한 결과를 반환하기는 했지만 그 결
과를 의미 있게 활용하기는 어렵습니다. 이럴 때는
WHERE
절을 사용해 너무 자주 구매하는 제
품은 제외하고
JOIN
을 수행하는 편이 좋습니다. 이렇게 덜 중요한 제품을 미리 제외해 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
행동 데이터 분석

행동 데이터 분석

플로랑 뷔송
데이터 과학을 위한 통계(2판)

데이터 과학을 위한 통계(2판)

이준용, 피터 브루스, 앤드루 브루스, 피터 게데크

Publisher Resources

ISBN: 9791169210089