Skip to Content
SQL로 시작하는 데이터 분석
book

SQL로 시작하는 데이터 분석

by 캐시 타니무라, 박상근
August 2022
Beginner to intermediate
436 pages
9h 43m
Korean
Hanbit Media, Inc.
Content preview from SQL로 시작하는 데이터 분석
65
2
데이터 준비
서브쿼리를 사용하면 로직을 알아보기 쉽도록 코드를 구성할 수 있어, 필자는 서브쿼리 사용을 선호하는 편
입니다.
8
장에서는 각 절이 실행되는 순서와
SQL
쿼리를 잘 구성하는 방법을 알아봅니다.
어떤 레코드에서 중복이 발생했는지 자세히 알아보려면 다음과 같이 모든 필드의 값을 출력합
니다.
SELECT
*
FROM
(
SELECT
column_a, column_b, column_c...,
count
(*)
as
records
FROM...
GROUP
BY
1,2,3...
) a
WHERE
records
> 1
;
중복을 찾아내는 일과 중복을 처리하는 일은 다릅니다. 왜 중복이 발생하는지 찾아냈다면 가능
한 한 그 원인을 제거해야 합니다. 데이터 처리 과정을 어떻게 개선해야 중복을 방지할 수 있을
까요?
ETL
과정에서 오류가 발생한다면? 일대다
one
-
to
-
many
관계의
JOIN
을 수행하는 데 문제
가 발생했다면? 다음 절에서
SQL
을 활용해 이러한 중복 데이터를 처리하는 방법을 알아봅시다.
2.4.2
중복 제거
중복 데이터가 무조건 나쁘지는 않습니다. 거래 이력이 있는 고객 모두에게 다음 주문 시 사용
가능한 쿠폰을 보낸다고 가정합시다. 먼저, 다음과 같이
customer
테이블과
transaction
이블에
JOIN
을 수행해 거래 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

행동 데이터 분석

행동 데이터 분석

플로랑 뷔송
견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
파이썬으로 살펴보는 아키텍처 패턴

파이썬으로 살펴보는 아키텍처 패턴

오현석, 해리 퍼시벌, 밥 그레고리
실무로 통하는 클린 코드

실무로 통하는 클린 코드

막시밀리아노 콘티에리

Publisher Resources

ISBN: 9791169210089