피벗테이블은 스프레드시트 프로그램과 그 외 다른 데이터 분석 소프트웨어에서 흔히 볼 수 있
는 데이터 요약화 도구다. 피벗테이블은 데이터를 하나 이상의 키로 수집해서 어떤 키는 로우에,
어떤 키는 컬럼에 나열해서 데이터를 정렬한다.
pandas
에서 피벗테이블은 이 장에서 설명했던
groupby
기능을 사용해서 계층적 색인을 활용한 재형성 연산을 가능하게 해준다.
DataFrame
에는
pivot
_
table
메서드가 있는데 이는
pandas
모듈의 최상위 함수로도 존재한다(
pandas
.
pivot
_
table
).
groupby
를 위한 편리한 인터페이스를 제공하기 위해
pivot
_
table
은 마진이
라고 하는 부분합을 추가할 수 있는 기능을 제공한다.
팁 데이터로 돌아가서 요일(
day
)과 흡연자(
smoker
) 집단에서 평균(
pivot
_
table
의 기본 연산)
을 구해보자.
In
[
130
]:
tips
.
pivot
_
table
(
index
=
['
day
',
'
smoker
'])
Out
[
130
]:
size tip tip
_
pct total
_
bill
day smoker
Fri No 2
.
250000 2
.
812500 0
.
151650 18
.
420000
Yes 2
.
066667 2
.
714000 0
.
174783 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.