Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
550
파이썬 라이브러리를 활용한 데이터 분석(2판)
데이터 파일을 열어본 독자라면 영화 장르가 파이프 (
|
)로 구분되어 제공되고 있다는 사실을
알 수 있다. 만일 영화 장르에 기반한 분석을 하려면 영화 장르 정보를 좀 더 사용하기 편한 형
식으로 변형할 필요가 있다.
14.3
신생아 이름
미국사회보장국 (
SSA
)에서는
1880
년부터 현재까지 가장 빈도가 높은 신생아 이름에 대한 정
보를 제공하고 있다. 여러 가지 유명한
R
패키지 개발자인 해들리 위컴은
R
에서 데이터를 다루
는 방법을 설명할 때 종종 이 데이터셋을 활용한다.
이 데이터셋을 불러 오려면 데이터를 다듬는 과정이 필요한데 일단 정리하고 나면 다음과 같은
DataFrame
을 얻을 수 있다.
In
[
4
]:
names
.
head
(
10
)
Out
[
4
]:
name sex births year
0 Mary F 7065 1880
1 Anna F 2604 1880
2 Emma F 2003 1880
3 Elizabeth F 1939 1880
4 Minnie F 1746 1880
5 Margaret F 1578 1880
6 Ida F 1472 1880
7 Alice F 1414 1880
8 Bertha F 1320 1880
9 Sarah F 1288 1880
이 데이터를 이용해서 여러 가지 분석을 할 수 있다.
시대별로 특정 이름이 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905