Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
177
4
회귀와 예측
update(step_lm, . ~ . -SqFtTotLiving - SqFtFinBasement - Bathrooms)
Call:
lm(formula = AdjSalePrice ~ Bedrooms + BldgGrade + PropertyType +
YrBuilt, data = house0, na.action = na.omit)
Coefficients:
(Intercept) Bedrooms
4834680 27657
BldgGrade PropertyTypeSingle Family
245709 -17604
PropertyTypeTownhouse YrBuilt
-47477 -3161
update
함수를 사용해서, 모델의 변수를 추가하거나 제외할 수 있다. 이제 침실 수에 대한 계
수가 우리가 기대했던 대로 양수인 것을 확인할 수 있다(침실 수가 실제 주택 크기에 대한 대
리변수로 작용했지만, 이제는 해당 변수가 제거된 상태이다 ).
변수 간 상관관계는 회귀계수를 해석할 때 고려해야 할 여러 문제들 가운데 한 가지일뿐이다.
모델
house
_
lm
에는 주택의 위치를 고려할 변수가 따로 없는 상태에서, 서로 다른 유형의 지역들
정보가 섞여 있다. 이 경우, 위치 정보는
교란변수
일 수 있다. 자세한 내용은
4
.
5
.
3
절을 참고하자.
4.5.2
다중공선성 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984