Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
481
12
고급 pandas
지금까지는 다양한 종류의 데이터를 다듬는 과정과
NumPy
,
pandas
그리고 다른 라이브러리
의 기능을 소개했다. 시간이 갈수록
pandas
에는 고급 사용자를 위한 깊이 있는 기능들이 추가
되고 있다. 이 장에서는 고급
pandas
사용자가 되기 위한 몇 가지 고급 기능을 소개하겠다.
12.1
Categorical
데이터
이 절에서는
pandas
Categorical
형을 활용하여
pandas
메모리 사용량을 줄이고 성능을
개선할 수 있는 방법을 소개한다. 통계와 머신러닝에서 범주형 데이터를 활용하기 위한 도구들
도 함께 소개하겠다.
12.1.1
개발 배경과 동기
하나의 컬럼 내에 특정 값이 반복되어 존재하는 경우는 흔하다. 우리는 이미 배열 내에서 유일한
값을 추출하거나 특정 값이 얼마나 많이 존재하는지 확인할 수 있는
unique
value
_
counts
같은 메서드를 공부했다.
In
[
10
]:
import numpy as np
;
import pandas as pd
고급
pandas
CHAPTER
12
482
파이썬 라이브러리를 활용한 데이터 분석(2판 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905