Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
392
파이썬 라이브러리를 활용한 데이터 분석(2판)
0 a one
1 a two
2 b one
3 b two
4 a one
10.1.2
컬럼이나 컬럼의 일부만 선택하기
DataFrame
에서 만든
GroupBy
객체를 컬럼 이름이나 컬럼 이름이 담긴 배열로 색인하면 수
집을 위해 해당 컬럼을 선택하게 된다.
df
.
groupby
('
key1
')['
data1
']
df
.
groupby
('
key1
')[['
data2
']]
위 코드는 아래 코드에 대한 신택틱 슈거로 같은 결과를 반환한다.
df
['
data1
'].
groupby
(
df
['
key1
'])
df
[['
data2
']].
groupby
(
df
['
key1
'])
특히 대용량 데이터를 다룰 경우 소수의 컬럼만 집계하고 싶을 때가 종종 있는데, 예를 들어 위
데이터에서
data2
컬럼에 대해서만 평균을 구하고 결과를
DataFrame
으로 받고 싶다면 아래
와 같이 작성한다.
In
[
31
]:
df
.
groupby
(['
key1
',
'
key2
'])[['
data2
']].
mean
()
Out
[
31
]:
data2
key1 key2
a one 1
.
319920
two 0
.
092908
b one 0
.
281746
two 0
.
769023
색인으로 얻은 객체는
groupby
메서드에 리스트나 배열을 넘겼을 경우
DataFrameGroupBy
객체가 되고, 단일 값으로 하나의 컬럼 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905