Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
85
2
데이터와 표본분포
• 측정의 정확도를 눈여겨볼 필요가 있는 엔지니어 분야에서는 다른 많은 분야들보다 신뢰구간을 자주 사용한
다. 톰 라이언
Tom
Ryan
이 쓴 『
Modern
Engineering
Statistics
』(
Wiley
,
2007
)은 신뢰구간에 대한 논의
를 담고 있다. 또한 유용성에 비해 관심을 별로 받지 못하는 예측구간 (평균 또는 다른 요약통계와는 다른, 단일
값 주위의 구간 )에 대해서도 다룬다.
2.6
정규분포
종 모양의
정규분포
normal
distribution
는 전통적인 통계의 상징이다.
3
표본통계량 분포가 보통 어떤
일정한 모양이 있다는 사실은 이 분포를 근사화하는 수학 공식을 개발하는 데 강력한 도구가
되었다.
용어 정리
오차
error
: 데이터 포인트와 예측값 혹은 평균 사이의 차이
표준화(정규화 )하다
standardize
: 평균을 빼고 표준편차로 나눈다.
z
점수
z
-
score
: 개별 데이터 포인트를 정규화한 결과
표준정규분포
standard
normal
distribution
: 평균=
0
, 표준편차=
1
인 정규분포
QQ
그림
QQ
-
plot
: 표본분포가 정규분포에 얼마나 가까운지를 보여주는 그림
정규분포(그림
2
-
10
)에서 데이터의
68
%는 평균의 표준편차 내에 속하며
95
%는 표준편차 두
배수 내에 있다.
CAUTION ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984