Skip to Main Content
파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
book

파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지

by 한창진, 이병욱, 클린턴 브라운리
November 2017
Beginner to intermediate content levelBeginner to intermediate
368 pages
7h 48m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
316
파이썬 데이터 분석 입문
질의 평균은 절편에 해당하는
5
.
8184
이고 표준오차는
0
.
009
가 되리라고 기대할 수 있다.
7.2.7
예측하기
어떤 경우에는 회귀모형에 피팅하는 데 사용하지 않은 새로운 데이터에 대한 예측이 필요하다.
예를 들어 새로운 관측값이 생겼을 때 그 품질을 예측하고 싶은 경우다. 실습을 위해 기존 와인
품질 데이터셋에서 처음
10
개의 관측값을 선택하여 새로운 데이터셋을 만들고, 이들을 새로운
관측값이라 치고 와인 특성에 따른 품질을 예측해보자.
이 예제에서는 편의상 이미 모델링에 사용한 기존 데이터셋의 관측값을 다시 사용하겠지만, 실
제로는 모델링에 사용하지 않은 새로운 데이터에 대해 품질을 예측하고 모형을 평가하게 된다
는 점을 명심하자. 이러한 점을 염두에 두고 ‘새로운’ 데이터셋을 만들고 품질을 예측해보자.
123
124
125
126
127
#
기존
데이터셋의
10
값을
가지고
'
새로운
'
관측값
데이터셋을
만듦
new_observations = wine.ix[wine.index.isin(range(10)), independent_variables.columns]
y_predicted = lm.predict(new_observations)
y_predicted_rounded = [round(score, 2) for score in ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

류광, 데이비드 칼라베라, 로렌초 폰타나

Publisher Resources

ISBN: 9791162240144