상자 그림은 그룹별 데이터 분포를 확인해 이상값을 찾을 때도 활용합니다. 예를 들어, 일본
에서 발생한 지진을 연도별로 구분해 비교하면서 아웃라이어를 확인해봅시다. [그림
6
-
9
]는
time
필드에서 가져온 지진 발생 연도와 규모 데이터로 그린 그래프입니다.
SELECT
date_part(‘year’,
time
)::int
as
year
,mag
FROM
earthquakes
WHERE
place
like
‘%Japan%’
ORDER
BY
1,2
;
year mag
---- ---
2010 3.6
2010 3.7
2010 3.7
... ...
2010
~
2020
년에 일본에서 발생한 지진 규모
규모
연도
그림
6-9
일본에서 발생한 지진의 연도별 규모 분포
중앙값과 박스의 범위는 연도별로 조금씩 바뀌지만 대체로 규모
4
~
5
수준으로 일관됩니다. 일
본에서는 규모가
6
.
0
보다 큰 아웃라이어 지진이
1
년에 한 번 이상 발생했으며, 규모가
7
.
0
이
326
SQL로 시작하는 데이터 분석
상인 지진이 한 번 이상 발생한 연도는
6
개입니다. 데이터에 따르면 일본은 의심할 여지 없이 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.