Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
393
10
데이터 집계와 그룹 연산
In
[
32
]:
s
_
grouped
=
df
.
groupby
(['
key1
',
'
key2
'])['
data2
']
In
[
33
]:
s
_
grouped
Out
[
33
]:
<
pandas
.
core
.
groupby
.
SeriesGroupBy object at 0x7faa30c78da0
>
In
[
34
]:
s
_
grouped
.
mean
()
Out
[
34
]:
key1 key2
a one 1
.
319920
two 0
.
092908
b one 0
.
281746
two 0
.
769023
Name
:
data2
,
dtype
:
float64
10.1.3
사전과
Series
에서 그룹핑하기
그룹 정보는 배열이 아닌 형태로 존재하기도 한다. 다른
DataFrame
예제를 살펴보자.
In
[
35
]:
people
=
pd
.
DataFrame
(
np
.
random
.
randn
(
5
,
5
),
....:
columns
=
['
a
',
'
b
',
'
c
',
'
d
',
'
e
'],
....:
index
=
['
Joe
',
'
Steve
',
'
Wes
',
'
Jim
',
'
Travis
'])
In
[
36
]:
people
.
iloc
[
2
:
3
,
[
1
,
2
]]
=
np
.
nan
#
nan
값을
추가하자
.
In
[
37
]:
people
Out
[
37
]:
a b c d e
Joe 1
.
007189
-
1
.
296221 0
.
274992 0
.
228913 1
.
352917 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905