Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
555
14
데이터 분석 예제
4 Minnie F 1746 1880 0
.
019188
...
...
..
...
...
...
1690779 Zymaire M 5 2010 0
.
000003
1690780 Zyonne M 5 2010 0
.
000003
1690781 Zyquarius M 5 2010 0
.
000003
1690782 Zyran M 5 2010 0
.
000003
1690783 Zzyzx M 5 2010 0
.
000003
[
1690784 rows x 5 columns
]
그룹 관련 연산을 수행할 때는 모든 그룹에서
prop
컬럼의 합이
1
이 맞는지 확인하는 새너티
테스트를 하는 게 좋다.
In
[
106
]:
names
.
groupby
(['
year
',
'
sex
']).
prop
.
sum
()
Out
[
106
]:
year sex
1880 F 1
.
0
M 1
.
0
1881 F 1
.
0
M 1
.
0
1882 F 1
.
0
...
2008 M 1
.
0
2009 F 1
.
0
M 1
.
0
2010 F 1
.
0
M 1
.
0
Name
:
prop
,
Length
:
262
,
dtype
:
float64
이제 모든 준비가 끝났고, 분석에 사용할 각 연도별/성별에 따른 선호하는 이름
1
,
000
개를 추
출하자. 이것 역시 그룹 연산이다.
def get
_
top1000
(
group
):
return group
.
sort
_
values
(
by
=
'
births
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905