
Data Science
166
로 계산해 주는 것을 봤을 것이다.
비즈니스 모델은 간단한 수학적인 관계에 기반을 둔다. 예를 들어 이익은 매
출에서 비용을 뺀 값이며, 매출은 평균 가격에 판매량을 곱한 값이다. 요리 책
모델은 시행착오를 기반으로, 누군가는 직접 다양한 재료의 조합으로 가장 마음
에 드는 조합을 찾을 때까지 요리를 시도해 봤을 것이다. 그리고 포커 모델은 확
률 이론, 포커 규칙, 카드가 분배되는 불규칙한 과정에 대한 적절한 가정으로 만
들어 졌을 것이다.
11.2
기계학습이란?
사람마다 기계학습에 대한 정의는 다르겠지만 이 책에서는 기계학습(
machine
learning
)을 데이터를 통해 모델을 만들고 사용하는 것이라고 정의하겠다. 다
른 맥락에서 이는
예측 모델링(
predictive
modeling
) 혹은 데이터마이닝(
data
mining
)이라 불릴 수도 있지만 일단 이 책에서는 그러한 과정을 기계학습이라
부르기로 한다. 보통 주어진 데이터로 모델을 구축하고, 새로운 데이터에 만들
어진 모델을 적용하면 다음과 같이 다양한 것을 예측해 볼 수 있다.
· 이메일이 스팸 메일인지 아닌지 예측
· 신용카드 사기 예측
· 쇼핑 고객이 클릭할 확률이 높은 광고 예측
· 슈퍼볼에서 우승할 미식 축구팀 예측
우리는 학습에 사용될 데이터에 정답이 ...