
316
파이썬 데이터 분석 입문
질의 평균은 절편에 해당하는
5
.
8184
이고 표준오차는
0
.
009
가 되리라고 기대할 수 있다.
7.2.7
예측하기
어떤 경우에는 회귀모형에 피팅하는 데 사용하지 않은 새로운 데이터에 대한 예측이 필요하다.
예를 들어 새로운 관측값이 생겼을 때 그 품질을 예측하고 싶은 경우다. 실습을 위해 기존 와인
품질 데이터셋에서 처음
10
개의 관측값을 선택하여 새로운 데이터셋을 만들고, 이들을 새로운
관측값이라 치고 와인 특성에 따른 품질을 예측해보자.
이 예제에서는 편의상 이미 모델링에 사용한 기존 데이터셋의 관측값을 다시 사용하겠지만, 실
제로는 모델링에 사용하지 않은 새로운 데이터에 대해 품질을 예측하고 모형을 평가하게 된다
는 점을 명심하자. 이러한 점을 염두에 두고 ‘새로운’ 데이터셋을 만들고 품질을 예측해보자.
123
124
125
126
127
#
기존
데이터셋의
첫
10
개
값을
가지고
'
새로운
'
관측값
데이터셋을
만듦
new_observations = wine.ix[wine.index.isin(range(10)), independent_variables.columns]
y_predicted = lm.predict(new_observations)
y_predicted_rounded = [round(score, 2) for score in ...