
25
1
장
시작하기 전에
1.1
이 책에서 다루는 내용
이 책은 파이썬으로 데이터를 다루는 다양하고 기본적인 방법을 소개한다. 그러기 위해 파이썬
프로그래밍 언어의 일부와 데이터 분석 문제를 효율적으로 해결하는 데 도움이 되는 몇 가지
라이브러리를 다룬다. ‘데이터 분석’이 이 책의 제목이긴 하지만 데이터 분석 방법론이 아니라
파이썬 프로그래밍, 라이브러리 그리고 사용하는 도구에 집중한다. 데이터 분석을 위해 여러분
에게 반드시 필요한 것은 파이썬 프로그래밍이기 때문이다.
1.1.1
어떤 데이터를 사용하나
여기서 ‘데이터’는 정확히 무슨 뜻일까? 주된 의미는 구조화된 데이터다. 일부러 구조화된 데이
터라는 모호한 표현을 썼는데, 다음과 같은 여러 가지 형태의 데이터를 포함한다.
●
각 컬럼의 형식이 문자열, 숫자, 날짜 등으로 서로 다른 표 혹은 스프레드시트와 비슷한 데이터. 이는 관계형
데이터베이스 혹은 탭이나 쉼표로 구분되는 텍스트 파일 형식으로 저장되는 대부분의 데이터를 포함한다.
●
다차원 배열 (행렬 )
●
SQL
에서 기본키나 외래키 같은 키 컬럼에 의해 서로 연관되는 여러 가지 표
●
일정하거나 일정하지 않은 간격의 시계열
이 목록에 있는 형식이 전부는 아니다. 항상 명백하지는 않겠지만 대부분의 데이터는 모델링이
나 분석을 위해 좀 더 쉬운 ...