Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
418
파이썬 라이브러리를 활용한 데이터 분석(2판)
10.4
피벗테이블과 교차일람표
피벗테이블은 스프레드시트 프로그램과 그 외 다른 데이터 분석 소프트웨어에서 흔히 볼 수 있
는 데이터 요약화 도구다. 피벗테이블은 데이터를 하나 이상의 키로 수집해서 어떤 키는 로우에,
어떤 키는 컬럼에 나열해서 데이터를 정렬한다.
pandas
에서 피벗테이블은 이 장에서 설명했던
groupby
기능을 사용해서 계층적 색인을 활용한 재형성 연산을 가능하게 해준다.
DataFrame
에는
pivot
_
table
메서드가 있는데 이는
pandas
모듈의 최상위 함수로도 존재한다 (
pandas
.
pivot
_
table
).
groupby
를 위한 편리한 인터페이스를 제공하기 위해
pivot
_
table
마진
라고 하는 부분합을 추가할 수 있는 기능을 제공한다.
팁 데이터로 돌아가서 요일 (
day
)과 흡연자 (
smoker
) 집단에서 평균 (
pivot
_
table
의 기본 연산 )
을 구해보자.
In
[
130
]:
tips
.
pivot
_
table
(
index
=
['
day
',
'
smoker
'])
Out
[
130
]:
size tip tip
_
pct total
_
bill
day smoker
Fri No 2
.
250000 2
.
812500 0
.
151650 18
.
420000
Yes 2
.
066667 2
.
714000 0
.
174783 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905