Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
182
파이썬 라이브러리를 활용한 데이터 분석(2판)
5.1
pandas
자료구조 소개
pandas
에 대해 알아보려면
Series
DataFrame
, 이 두 가지 자료구조에 익숙해질 필요가
있다. 이 두 가지 자료구조로 모든 문제를 해결할 순 없지만 대부분의 애플리케이션에서 사용
하기 쉬우며 탄탄한 기반을 제공한다.
5.1.1
Series
Series
는 일련의 객체를 담을 수 있는
1
차원 배열 같은 자료구조다(어떤
NumPy
자료형이라
도 담을 수 있다 ). 그리고 색인
index
이라고 하는 배열의 데이터와 연관된 이름을 가지고 있다.
가장 간단한
Series
객체는 배열 데이터로부터 생성할 수 있다.
In
[
11
]:
obj
=
pd
.
Series
([
4
,
7
,
-
5
,
3
])
In
[
12
]:
obj
Out
[
12
]:
0 4
1 7
2
-
5
3 3
dtype
:
int64
Series
객체의 문자열 표현은 왼쪽에 색인을 보여주고 오른쪽에 해당 색인의 값을 보여준다.
위 예제에서는 데이터의 색인을 지정하지 않았으니 기본 색인인 정수
0
에서
N
-
1
(
N
은 데이터
의 길이)까지의 숫자가 표시된다.
Series
의 배열과 색인 객체는 각각
values
index
속성을
통해 얻을 수 있다.
In
[
13
]:
obj
.
values
Out
[
13
]:
array
([
4
,
7
,
-
5
,
3
])
In
[
14 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905