Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
27
1
탐색적 데이터 분석
중간값
median
: 데이터에서 가장 가운데 위치한 값 (유의어:
50
번째 백분위수
percentile
)
가중 중간값
weighted
median
: 데이터를 정렬한 후, 각 가중치 값을 위에서부터 더할 때, 총합의 중간이 위치
하는 데이터 값
절사평균
trimmed
mean
: 정해진 개수의 극단값
extreme
value
을 제외한 나머지 값들의 평균 (유의어: 절단평
truncated
mean
)
로버스트하다
robust
: 극단값들에 민감하지 않다는 것을 의미한다. (유의어: 저항성 있다
resistant
)
특잇값
outlier
: 대부분의 값과 매우 다른 데이터 값 (유의어 : 극단값 )
데이터를 요약하려면 그냥 데이터의
평균
(다음 절 참고)을 구하기만 하면 되지 않느냐고 생각
할지도 모르겠다. 사실 평균이 계산하기도 쉽고 사용하기도 편리하긴 하다. 하지만 평균이 데
이터의 중간을 대표하는 가장 좋은 방법은 아니다. 몇 가지 이유로, 통계학자들은 평균을 대체
할 만한 다른 값들을 개발해냈다.
NOTE
_
측정 지표와 추정값
통계학자들은 보통 데이터로부터 얻은 값과 실제 상태를 나타내는 이론적인 참값을 구분하기 위해, 데이터로
부터 계산된 값들을 보통 추정값
estimate
이라는 용어를 사용한다. 반면 데이터 과학자나 비즈니스 분석가들은 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984