
from Scratch
xxi
초판 서문
데이터 과학
‘
21
세기의 가장 섹시한 직업’은 데이터 과학자라고 한다.
1
(이 말을 한 사람은 소
방서에 가보지 않았나 보다.
2
) 실제로 데이터 과학은 많은 인기를 누리며 성장하
고 있고, 몇몇 애널리스트는 앞으로
10
년 안에 수십억 명의 데이터 과학자가 더
필요할 것이라고 침 튀기며 주장하기도 한다.
데이터 과학(
data
science
)이란 무엇인가? 이를 모른다면 데이터 과학자도 양
성할 수 없으니 먼저 데이터 과학이 무엇인지 이해하는 것이 중요하다. 업계에
서 제법 알려진 한 벤다이어그램
3
에 의하면 데이터 과학은 다음 세 가지 영역의
교집합이다.
· 해킹
4
실력
· 수학 및 통계에 관한 지식
· 도메인 전문성
처음에는 이 책에서 세 가지를 모두 다루려고 했으나, 도메인 전문성을 상세히
설명하기 위해서는 수만 페이지가 필요하다는 것을 깨달았다. 그래서 앞의 두
가지에 집중하기로 했다. 이 책의 목표는 데이터 과학을 시작하는 데 필요한 해
킹 실력을 키워 주고, 데이터 과학의 핵심인 수학 및 통계학에 익숙해질 수 있게
도와 주는 것이다.
어쩌면 이마저도 책 한 권에 담기에는 너무 많을 수 있다. 사실 해킹 실력을
키우기 위한 가장 좋은 방법은 직접 이것저것 해킹해 보는 것이다. 이 책을 읽고
나면 필자가 어떤 방식으로 ...