Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
509
13
파이썬 모델링 라이브러리
2 3 0
.
25 3
.
6 1 0
3 4
-
4
.
10 1
.
3 1 0
4 5 0
.
00
-
2
.
0 0 1
특정 통계 모델을 더미값으로 피팅하는 기법도 있다. 단순히 숫자형 컬럼만 가지고 있는 게 아
니라면 다음 절에서 살펴볼
Patsy
를 사용하는 편이 더 단순하고 에러를 일으킬 가능성도 줄여
준다.
13.2
Patsy
를 이용해서 모델 생성하기
Patsy
(팻시 )는 통계 모델 (특히 선형 모델 )을 위한 파이썬 라이브러리이며
R
이나
S
통계 프로
그래밍 언어에서 사용하는 수식 문법과 비슷한 형식의 문자열 기반 ‘수식 문법’을 제공한다.
Patsy
는 통계 모델에서 선형 모델을 잘 지원하므로 이해를 돕기 위해 주요 기능 중 일부만 살
펴보도록 하자.
Patsy
의 수식 문법은 다음과 같은 특수한 형태의 문자열이다.
y
~
x0
+
x1
a
+
b
문법은
a
b
를 더하라는 의미가 아니라 모델을 위해 생성된 배열을 설계하는 용법이다.
patsy
.
dmatrices
함수는 수식 문자열과 데이터셋 (
DataFrame
또는 배열의 사전 )을 함께 받
아 선형 모델을 위한 설계 배열을 만들어낸다.
In
[
29
]:
data
=
pd
.
DataFrame
({
....:
'
x0
':
[
1
,
2
,
3
,
4
,
5
],
....:
'
x1
':
[
0
.
01
,
-
0
.
01
,
0
.
25
,
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905