Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
395
10
데이터 집계와 그룹 연산
10.1.4
함수로 그룹핑하기
파이썬 함수를 사용하는 것은 사전이나
Series
를 사용해서 그룹을 매핑하는 것보다 좀 더 일
반적인 방법이다. 그룹 색인으로 넘긴 함수는 색인값 하나마다 한 번씩 호출되며, 반환값은
그 그룹의 이름으로 사용된다. 좀 더 구체적으로 말하자면 좀 전에 살펴본 예제에서
people
DataFrame
은 사람의 이름을 색인값으로 사용했다. 만약 이름의 길이별로 그룹을 묶고 싶다
면 이름의 길이가 담긴 배열을 만들어 넘기는 대신
len
함수를 넘기면 된다.
In
[
44
]:
people
.
groupby
(
len
).
sum
()
Out
[
44
]:
a b c d e
3 0
.
591569
-
0
.
993608 0
.
798764
-
0
.
791374 2
.
119639
5 0
.
886429
-
2
.
001637
-
0
.
371843 1
.
669025
-
0
.
438570
6
-
0
.
713544
-
0
.
831154
-
2
.
370232
-
1
.
860761
-
0
.
860757
내부적으로는 모두 배열로 변환되므로 함수를 배열, 사전 또는
Series
와 섞어 쓰더라도 전혀
문제가 되지 않는다.
In
[
45
]:
key
_
list
=
['
one
',
'
one
',
'
one
',
'
two
',
'
two
']
In
[
46
]:
people
.
groupby
([
len
,
key
_
list
]).
min ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905