Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
307
8
데이터 준비하기: 조인, 병합, 변형
대부분의 경우 데이터는 여러 파일이나 데이터베이스 혹은 분석하지 쉽지 않은 형태로 기록되
어 있다. 이 장에서는 데이터를 합치고, 재배열할 수 있는 도구들을 살펴보자.
먼저 데이터를 병합하거나 변환하는 과정에서 사용되는
pandas
의 계층적 색인의 개념을 알아
보고 이를 활용하여 데이터를 다듬는 과정을 심도 있게 살펴볼 것이다.
14
장에서도 이런 도구
를 사용하는 다양한 예시를 볼 수 있다.
8.1
계층적 색인
계층적 색인
pandas
의 중요한 기능인데 축에 대해 다중(둘 이상 ) 색인 단계를 지정할 수 있
도록 해준다. 약간 추상적으로 말하면, 높은 차원의 데이터를 낮은 차원의 형식으로 다룰 수 있
게 해주는 기능이다. 간단한 예제를 하나 살펴보자. 우선 리스트의 리스트 (또는 배열 )를 색인
으로 하는
Series
를 하나 생성하자.
In
[
9
]:
data
=
pd
.
Series
(
np
.
random
.
randn
(
9
),
...:
index
=
[['
a
',
'
a
',
'
a
',
'
b
',
'
b
',
'
c
',
'
c
',
'
d
',
'
d
'],
...:
[
1
,
2
,
3
,
1
,
3
,
1
,
2
,
2
,
3
]])
In
[
10
]:
data
Out
[
10
]:
데이터 준비하기: 조인, 병합, 변형
CHAPTER
8
308
파이썬 라이브러리를 활용한 데이터 분석(2판 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905