Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
614
파이썬 라이브러리를 활용한 데이터 분석(2판)
In
[
158
]:
data
['
y
']
Out
[
158
]:
array
([
5
,
6
],
dtype
=
int32
)
In
[
159
]:
data
['
x
']['
a
']
Out
[
159
]:
array
([
1
.,
3
.])
pandas
DataFrame
의 계층적 색인은 이와 유사하긴 하지만 이런 기능을 직접 지원하지는 않
는다.
A.5.2
구조화된 배열을 써야 하는 이유
pandas
DataFrame
과 비교해보면
NumPy
의 구조화된 배열은 상대적으로 저수준의 도구다.
메모리 블록을 복잡하게 중첩된 컬럼이 있는 표 형식처럼 해석할 수 있는 방법을 제공한다. 배
열의 각 원소는 메모리상에서 고정된 크기의 바이트로 표현되기 때문에 구조화된 배열은 데이
터를 디스크에서 읽거나 쓰고(나중에 살펴볼 메모리 맵을 포함하여 ) 네트워크를 통해 전송할
때 매우 빠르고 효과적인 방법을 제공한다.
구조화된 배열의 또 다른 일반적인 사용 방법인 데이터 파일을 고정된 크기의 레코드 바이트
스트림으로 기록하는 것은
C
C
++ 코드에서 데이터를 직렬화하는 일반적인 방법이다. 파일
의 포맷을 알고 있다면(즉, 각 레코드의 크기와 순서, 바이트 크기 그리고 각 원소의 자료형을
알고 있다면 )
np
.
fromfile
을 사용해서 데이터를 메모리로 읽어 들일 수 있다. 이와 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905