290
개발자를 위한 필수 수학
따라서 필자는 고객들에게 데이터 과학에 대한 더 나은 정의는 통계, 머신러닝, 최적화에 능숙
한 소프트웨어 공학이라고 말합니다. 소프트웨어 공학, 통계, 머신러닝, 최적화, 이 네 가지 분
야 중 하나라도 빠지면 데이터 과학자는 성과를 내지 못할 위험에 처합니다. 대부분의 조직은
데이터 과학자를 효과적으로 만드는 기술 집합을 명확하게 구분하는 데 어려움을 겪습니다. 하
지만 정의는 명확해야 합니다. 일부에서는 소프트웨어 엔지니어링이 논란의 여지가 있는 요구
사항이라고 생각할 수 있지만, 산업이 나아가고 있는 방향을 고려하면 매우 필요합니다. 이 점
은 나중에 다시 살펴봅니다.
먼저 데이터 과학을 이해하는 가장 좋은 방법은 데이터 과학이라는 용어의 역사를 추적하는 것
입니다.
8.2
데이터 과학의 간략한 역사
데이터 과학의 기원은
17
세기 또는 심지어
8
세기까지 거슬러 올라갑니다. 간략하게
1990
년대
부터 시작하겠습니다. 분석가, 통계학자, 연구원, 퀀트
quant
, 데이터 엔지니어는 서로 다른 역할
을 수행했습니다. 도구 스택은 종종 스프레드시트,
R
, 매트랩,
SAS
,
SQL
로 구성되었습니다.
물론
2000
년 이후 상황은 급변했습니다. 인터넷과 연결된 기기가 엄청난 양의 데이터를 생성
하기 시작했죠. 하둡
Hadoop
의 시작과 함께 구글은 분석 및 데이터 수집을 상상할 수 없는 수준으
로 끌어올렸습니다.
2010
년이 다가오자 구글의 경영진은 통계학자가 향후
10
년 내에 매력적
인 직업을 갖게 될 것이라고 주장했습니다 ...