Skip to Content
For Enterprise
For Government
For Higher Ed
For Individuals
For Marketing
For Enterprise
For Government
For Higher Ed
For Individuals
For Marketing
Explore Skills
Cloud Computing
Microsoft Azure
Amazon Web Services (AWS)
Google Cloud
Cloud Migration
Cloud Deployment
Cloud Platforms
Data Engineering
Data Warehouse
SQL
Apache Spark
Microsoft SQL Server
MySQL
Kafka
Data Lake
Streaming & Messaging
NoSQL Databases
Relational Databases
Data Science
Pandas
R
MATLAB
SAS
D3
Power BI
Tableau
Statistics
Exploratory Data Analysis
Data Visualization
AI & ML
Generative AI
Machine Learning
Artificial Intelligence (AI)
Deep Learning
Reinforcement Learning
Natural Language Processing
TensorFlow
Scikit-Learn
Hyperparameter Tuning
MLOps
Programming Languages
Java
JavaScript
Spring
Python
Go
C#
C++
C
Swift
Rust
Functional Programming
Software Architecture
Object-Oriented
Distributed Systems
Domain-Driven Design
Architectural Patterns
IT/Ops
Kubernetes
Docker
GitHub
Terraform
Continuous Delivery
Continuous Integration
Database Administration
Computer Networking
Operating Systems
IT Certifications
Security
Network Security
Application Security
Incident Response
Zero Trust Model
Disaster Recovery
Penetration Testing / Ethical Hacking
Governance
Malware
Security Architecture
Security Engineering
Security Certifications
Design
Web Design
Graphic Design
Interaction Design
Film & Video
User Experience (UX)
Design Process
Design Tools
Business
Agile
Project Management
Product Management
Marketing
Human Resources
Finance
Team Management
Business Strategy
Digital Transformation
Organizational Leadership
Soft Skills
Professional Communication
Emotional Intelligence
Presentation Skills
Innovation
Critical Thinking
Public Speaking
Collaboration
Personal Productivity
Confidence / Motivation
Features
All features
Verifiable skills
AI Academy
Courses
Certifications
Interactive learning
Live events
Superstreams
Answers
Insights reporting
Radar Blog
Buy Courses
Plans
Sign In
Try Now
O'Reilly Platform
book
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
by
김영근
,
웨스 맥키니
June 2019
Beginner to intermediate
664 pages
18h 26m
Korean
Hanbit Media, Inc.
Content preview from
파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용
229
5
장
pandas 시작하기
메서드
설명
mean
평균을 계산한다.
median
중간값
(
50
% 분위
)
을 반환한다.
mad
평균값에서 평균절대편차를 계산한다.
prod
모든 값의 곱
var
표본분산의 값을 계산한다.
std
표본표준편차의 값을 계산한다.
skew
표본비대칭도
(
3
차 적률
)
의 값을 계산한다.
kurt
표본첨도
(
4
차 적률
)
의 값을 계산한다.
cumsum
누적합을 계산한다.
cummin
,
cummax
각각 누적 최솟값과 누적 최댓값을 계산한다.
cumprod
누적곱을 계산한다.
diff
1
차 산술차를 계산한다
(
시계열 데이터 처리 시 유용하다
).
pct
_
change
퍼센트 변화율을 계산한다.
5.3.1
상관관계와 공분산
상관관계나 공분산 같은 요약 통계 계산은 두 쌍의 인자를 필요로 한다.
pandas
-
datareader
패키지를 이용해서 야후! 금융 사이트에서 구한 주식가격과 시가총액을 담고 있는 다음
DataFrame
을 생각해보자. 아직 설치하지 않았다면
conda
나
pip
를 통해 설치할 수 있다.
conda install pandas
-
datareader
pandas
_
datareader
모듈을 이용해서 주가 정보를 다운로드하자.
import
pandas
_
datareader
.
data
as
web
all
_
data
=
{
ticker
:
web
.
get
_
data
_
yahoo
(
ticker ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial
You might also like
파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서
박해선, 안드레아스 뮐러, 세라 가이도
엑셀, R, 파이썬으로 시작하는 데이터 분석 : 데이터 분석의 기본 개념과 3가지 핵심 도구 사용법
조지 마운트
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
이준용, 피터 브루스, 앤드루 브루스
훌륭한 프로그래머 되는 법: 프로젝트와 팀을 성공으로 이끄는 선배 개발자의 노하우
최원재, 강전희, 안재덕, 남윤화, 피트 구들리프
Publisher Resources
ISBN: 9791162241905