26
파이썬 라이브러리를 활용한 데이터 분석(2판)
서 구조화된 형태로 만들 수 있다. 예를 들어 뉴스 기사 모음은 사용 단어 빈도표를 만들어 감
성 분석에 사용할 수도 있다.
아마도 전 세계적으로 가장 널리 사용되고 있는 데이터 분석 툴인 마이크로소프트 엑셀 같은
스프레드시트 프로그램 사용자는 이런 종류의 데이터가 낯설지 않을 것이다.
1.2
왜 데이터 분석에 파이썬을 사용하나
파이썬은 매력적인 언어다.
1991
년 처음 발표된 이래 펄, 루비 같은 인기 있는 언어가 되었다.
특히 최근 몇 년 사이에 레일즈 (루비 ), 장고 (파이썬 ) 같은 다양한 웹 프레임워크로 웹사이트
를 만들면서 파이썬과 루비는 큰 인기를 얻었다. 이런 언어는 스크립트 언어라고 불리는데, 작
은 프로그램이나 업무 자동화 스크립트를 빠르고 간단하게 만들 수 있다. 개인적으로 ‘스크립
트 언어’라는 용어를 좋아하지 않는데, 이름 자체에 제대로 된 소프트웨어를 만드는 데는 사용
하지 못한다는 의미를 담고 있기 때문이다. 인터프리터 언어 사이에서도 파이썬은 다양한 역사
적, 문화적 이유로 인해 방대하고 활동적인 과학 계산 컴퓨팅 커뮤니티에서 사용되고 있다. 지
난
10
년간 파이썬은 ‘대안 언어’ 위치에서 데이터 과학, 머신러닝 그리고 범용 소프트웨어 개발
에 이르기까지 학계와 업계 모두에서 가장 중요한 프로그래밍 언어 중 하나로 성장했다.
파이썬은 데이터 분석과 대화형(인터랙티브 ) 컴퓨팅, 데이터 시각화에서 자주 사용하는
R
, 매
트랩
MATLAB
,
SAS
,
Stata
같은 오픈소스나 ...