Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
189
4
회귀와 예측
통계적 추론 (
p
값,
F
통계량 등)을 입증하기 위해서 분포 가정을 만족시키는 것은 데이터 과
학자에게 그리 중요한 일이 아니다.
NOTE
_
산점도 평활기
회귀분석은 응답변수와 예측변수 간의 관계를 모델링하는 것이다. 회귀모형을 평가할 때는 두 변수 사이의
관계를 시각적으로 강조하기 위해 산점도 평활기
scatterplot
smoother
를 사용하는 것이 좋다.
예를 들면 [그림
4
-
7
]에서 절대잔차와 예측값 간의 관계를 부드럽게 나타낸 곡선을 통해, 잔차의 분산이 잔차
의 값에 의존한다는 것을 쉽게 알 수 있다. 이 경우
loess
함수를 사용한다.
loess
는 일련의 구간별 지역 회
귀모형을 구한 후 그것들을 연속적으로 부드럽게 만들어낸다(이를 평활화
smoothing
라고 부른다).
loess
가 가
장 널리 사용되는 평활기일 것이다. 하지만
R
에서는 슈퍼 평활(
supsmu
함수)이나 커널 평활(
ksmooth
함수)
과 같이, 다른 산점도 평활기를 사용할 수도 있다. 회귀모형을 평가할 목적이라면, 일반적으로 이러한 산점도
평활기에 대한 구체적인 내용을 알 필요는 없다.
4.6.4
편잔차그림과 비선형성
편잔차그림
은 예측 모델이 예측변수와 결과변수 간의 관계를 얼마나 잘 설명하는지 시각화하는
방법이다. 특잇점의 검출과 함께 이것은 데이터 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984