Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
487
12
고급 pandas
Out
[
40
]:
[
foo
,
bar
,
baz
,
foo
,
foo
,
bar
]
Categories
(
3
,
object
):
[
foo
<
bar
<
baz
]
여기서는 문자열만 예로 들었지만 범주형 데이터는 꼭 문자열일 필요는 없다. 범주형 배열은
변경이 불가능한 값이라면 어떤 자료형이라도 포함할 수 있다.
12.1.3
Categorical
연산
pandas
에서
Categorical
은 문자열 배열처럼 인코딩되지 않은 자료형을 사용하는 방식과 거
의 유사하게 사용할 수 있다.
groupby
같은 일부
pandas
함수는 범주형 데이터에 사용할 때 더
나은 성능을 보여준다.
ordered
플래그를 활용하는 함수들도 마찬가지다.
임의의 숫자 데이터를
pandas
.
qcut
함수로 구분해보자.
렇게 하면
pandas
.
Categorical
체를 반환한다. 책 초반부에서
pandas
.
cut
함수를 살펴봤지만 어떻게 범주형 데이터를 다루는
지는 제대로 설명하지 않았다.
In
[
41
]:
np
.
random
.
seed
(
12345
)
In
[
42
]:
draws
=
np
.
random
.
randn
(
1000
)
In
[
43
]:
draws
[:
5
]
Out
[
43
]:
array
([
-
0
.
2047
,
0
.
4789
,
-
0
.
5194
,
-
0
.
5557
,
1
.
9658
])
이 데이터를 사분위로 나누고 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905