Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
501
12
고급 pandas
3 b 2017
-
05
-
20 00
:
00
:
00 35
.
0
4 b 2017
-
05
-
20 00
:
05
:
00 110
.
0
5 b 2017
-
05
-
20 00
:
10
:
00 185
.
0
6 c 2017
-
05
-
20 00
:
00
:
00 40
.
0
7 c 2017
-
05
-
20 00
:
05
:
00 115
.
0
8 c 2017
-
05
-
20 00
:
10
:
00 190
.
0
TimeGrouper
를 사용할 때 주의해야 할 점은 시간값이
Series
혹은
DataFrame
의 색인이어야
한다는 점이다.
12.3
메서드 연결 기법
데이터셋을 여러 차례 변형해야 하는 경우 분석에는 전혀 필요 없는 임시 변수를 계속 생성하는
상황이 발생한다. 다음 예제를 살펴보자.
df
=
load
_
data
()
df2
=
df
[
df
['
col2
']
<
0
]
df2
['
col1
_
demeaned
']
=
df2
['
col1
']
-
df2
['
col1
'].
mean
()
result
=
df2
.
groupby
('
key
').
col1
_
demeaned
.
std
()
여기서 실제 데이터를 사용하지는 않지만 새로운 메서드 몇 가지를 만나게 되는데 그중 하나는
df
[
k
] =
v
처럼 컬럼에 값을 대입하는 함수형
DataFrame
.
assign
메서드다. 객체를 변경하는
대신 값 대입이 완료된 새로운
DataFrame
을 반환한다. 아래 두 코드는 동일하다.
#
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905