
20
데이터 과학을 위한 통계
보는
데이터 분석
data
analysis
이라는 새로운 과학적 학문을 제안했다. 투키는 통계를 공학과 컴퓨
터 과학 분야에 접목하기 위해 끊임없이 노력했다 (그는 이진수를 뜻하는 ‘비트’라든가 ‘소프트
웨어’ 같은 용어를 만들기도 했다). 그리고 이런 그의 오랜 신념은 아직까지 이어져, 데이터 과
학의 한 토대가 되고 있다. 탐색적 데이터 분석이란 분야는, 투키의
1977
년 이미 고전이 된 책
『탐색적 데이터 분석』
3
을 통해 정립되었다.
그림
1-1
탁월한 통계학자였던 존 투키,
50
년 전 그의 아이디어들이 데이터 과학의 기반이 되었다.
컴퓨터의 성능이 향상되고, 누구나 손쉽게 사용할 수 있는 데이터 분석 소프트웨어가 나오면
서, 탐색적 데이터 분석은 그 원래 범주를 훌쩍 뛰어넘어 진화되고 있다. 새로운 기술의 급속한
발전, 접근 가능한 더 많은 데이터, 그리고 다양한 학문에서 활용되고 있는 양적 분석은 통계학
을 이끄는 동력이 되었다. 과거 투키의 지도 학생이었던 데이비드 도노호
David
Donoho
스탠퍼드
대학교 통계학과 교수는, 투키 탄생
100
주년 기념 워크숍에서 발표한 내용을 바탕으로 훌륭한
논문을 썼다.
4
이 논문은 투키가 데이터 분석에서 보인 선구자적 업적까지 거슬러 올라가 데이
터 과학의 기원을 추적한다.
1.1
정형화된 ...