Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
66
데이터 과학을 위한 통계
이와 같은 자기 선택 표본은 상황을 정확히 파악하기 위한 지표로는 사용하기 어려울 수 있지만, 어떤 시설을
비슷한 시설과 단순 비교할 때는 오히려 더 신뢰할 만하다. 비슷한 자기 선택 편향이 각각의 경우에 똑같이
적용될 수 있기 때문이다.
2.1.1
편향
통계적 편향은 측정 과정 혹은 표본추출 과정에서 발생하는 계통적인
systematic
오차를 의미한다.
랜덤표본추출로 인한 오류와 편향에 따른 오류는 신중하게 구분해서 봐야 한다. 목표물에 총을
쏘는 과정을 생각해보자. 매번 목표물의 한가운데를 정확히 맞힌다는 것은 불가능하다. 한가운
데에 정확히 한 발 맞히기도 힘들 것이다. 편향되지 않은 프로세스에도 오차가 있긴 하지만, 그
것은 랜덤하며 어느 쪽으로 강하게 치우치는 경향이 없다 (그림
2
-
2
). 반면 [그림
2
-
3
]에 표시
된 결과는 편향을 보여준다.
x
방향과
y
방향 모두에서 랜덤한 오차가 있고 편향도 있다. 탄착
점이 오른쪽 위 사분면에 떨어지는 경향을 볼 수 있다.
그림
2-2
정확한 조준 사격에 의한 총알의 산점도
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984