Skip to Content
SQL로 시작하는 데이터 분석
book

SQL로 시작하는 데이터 분석

by 캐시 타니무라, 박상근
August 2022
Beginner to intermediate
436 pages
9h 43m
Korean
Hanbit Media, Inc.
Content preview from SQL로 시작하는 데이터 분석
59
2
데이터 준비
2-3
10
의 제곱수별 로그 값
형식 결과
log
(
1
)
0
log
(
10
)
1
log
(
100
)
2
log
(
1000
)
3
log
(
10000
)
4
log
함수는 인자
argument
의 로그 값을 반환하며, 인자에는 상숫값이나 필드를 지정합니다.
SELECT
log
(sales)
as
bin
,
count
(customer_id)
as
customers
FROM
table
GROUP
BY
1
;
log
함수의 인자로
10
의 배수가 아닌 다른 숫자를 사용할 수도 있지만,
0
이하의 값을 사용하
면 데이터베이스에 따라
null
을 반환하거나 오류가 발생합니다.
2.3.3
N
분위수
중앙값
median
또는 중간값의 의미는 여러분도 잘 알리라 생각합니다. 이 값은 다른 말로
50
번째
백분위수
percentile
값이라고도 합니다. 데이터셋의 절반이 중앙값보다 크고 나머지 절반은 중앙
값보다 작다는 의미입니다. 사분위수를 구하려면
25
번째 백분위수와
75
번째 백분위수 값을 사
용합니다. 제
1
사분위 값은
25
번째 백분위수 값보다 작고, 나머지 사분위 값은
25
번째 백분위
수 값보다 큽니다. 마찬가지로 제
3
사분위 값은
75
번째 백분위수 값보다 작고, 나머지 사분위
값은
75
번째 백분위수 값보다 큽니다. 십분위수
decile
는 데이터셋을
10
개 부분으로 나눕니다.
이 백분위수 개념을
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
행동 데이터 분석

행동 데이터 분석

플로랑 뷔송
데이터 과학을 위한 통계(2판)

데이터 과학을 위한 통계(2판)

이준용, 피터 브루스, 앤드루 브루스, 피터 게데크

Publisher Resources

ISBN: 9791169210089