Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
493
12
고급 pandas
메서드 설명
reorder
_
categories rename
_
categories
와 유사하지만 새로운 카테고리가 순서를 가지도록 한다.
set
_
categories
카테고리를 지정한 새로운 카테고리로 변경한다. 카테고리 추가나 삭제가 가능하다.
모델링을 위한 더미값 생성하기
통계나 머신러닝 도구를 사용하다 보면 범주형 데이터를 더미값으로 변환 (원핫
one
-
hot
인코딩
이라고도 함 )해야 하는 경우가 생긴다. 이를 위해 각각의 구별되는 카테고리를 컬럼으로 가지는
DataFrame
을 생성하는데, 각 컬럼에는 해당 카테고리 여부에 따라
0
1
의 값을 가지게 된다.
앞서 살펴본 예제를 다시 살펴보자.
In
[
73
]:
cat
_
s
=
pd
.
Series
(['
a
',
'
b
',
'
c
',
'
d
']
*
2
,
dtype
=
'
category
')
7
장에서 다루었듯이
pandas
.
get
_
dummies
함수는 이런
1
차원 범주형 데이터를 더미값을 가지
DataFrame
으로 변환한다.
In
[
74
]:
pd
.
get
_
dummies
(
cat
_
s
)
Out
[
74
]:
a b c d
0 1 0 0 0
1 0 1 0 0
2 0 0 1 0
3 0 0 0 1
4 1 0 0 0
5 0 1 0 0
6 0 0 1 0
7 0 0 0 1
12.2
고급
GroupBy
사용
10
장에서
Series
DataFrame ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905