Skip to Content
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
book

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

by 김영근, 웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
229
5
pandas 시작하기
메서드 설명
mean
평균을 계산한다.
median
중간값 (
50
% 분위 )을 반환한다.
mad
평균값에서 평균절대편차를 계산한다.
prod
모든 값의 곱
var
표본분산의 값을 계산한다.
std
표본표준편차의 값을 계산한다.
skew
표본비대칭도 (
3
차 적률 )의 값을 계산한다.
kurt
표본첨도 (
4
차 적률 )의 값을 계산한다.
cumsum
누적합을 계산한다.
cummin
,
cummax
각각 누적 최솟값과 누적 최댓값을 계산한다.
cumprod
누적곱을 계산한다.
diff
1
차 산술차를 계산한다 (시계열 데이터 처리 시 유용하다 ).
pct
_
change
퍼센트 변화율을 계산한다.
5.3.1
상관관계와 공분산
상관관계나 공분산 같은 요약 통계 계산은 두 쌍의 인자를 필요로 한다.
pandas
-
datareader
패키지를 이용해서 야후! 금융 사이트에서 구한 주식가격과 시가총액을 담고 있는 다음
DataFrame
을 생각해보자. 아직 설치하지 않았다면
conda
pip
를 통해 설치할 수 있다.
conda install pandas
-
datareader
pandas
_
datareader
모듈을 이용해서 주가 정보를 다운로드하자.
import pandas
_
datareader
.
data as web
all
_
data
=
{
ticker
:
web
.
get
_
data
_
yahoo
(
ticker ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162241905