
177
4
장
회귀와 예측
update(step_lm, . ~ . -SqFtTotLiving - SqFtFinBasement - Bathrooms)
Call:
lm(formula = AdjSalePrice ~ Bedrooms + BldgGrade + PropertyType +
YrBuilt, data = house0, na.action = na.omit)
Coefficients:
(Intercept) Bedrooms
4834680 27657
BldgGrade PropertyTypeSingle Family
245709 -17604
PropertyTypeTownhouse YrBuilt
-47477 -3161
update
함수를 사용해서, 모델의 변수를 추가하거나 제외할 수 있다. 이제 침실 수에 대한 계
수가 우리가 기대했던 대로 양수인 것을 확인할 수 있다(침실 수가 실제 주택 크기에 대한 대
리변수로 작용했지만, 이제는 해당 변수가 제거된 상태이다 ).
변수 간 상관관계는 회귀계수를 해석할 때 고려해야 할 여러 문제들 가운데 한 가지일뿐이다.
모델
house
_
lm
에는 주택의 위치를 고려할 변수가 따로 없는 상태에서, 서로 다른 유형의 지역들
정보가 섞여 있다. 이 경우, 위치 정보는
교란변수
일 수 있다. 자세한 내용은
4
.
5
.
3
절을 참고하자.
4.5.2
다중공선성 ...