
30
1
부
머신러닝
이 장에서는 모든 데이터 과학자가 꼭 알아야 할 여러 가지 기초 개념과 용어를 소개합니다. 거
시적인 소개를 담고 있으며 코드가 많지 않은 유일한 장입니다. 간단한 내용이지만 이 책의 나
머지를 읽기 전에 반드시 모든 내용을 완벽하게 이해해야 합니다. 커피 한잔하면서 같이 시작
해보죠 !
TIP
이미 머신러닝의 기초를 모두 알고 있다면
2
장으로 건너뛰어도 됩니다. 확실하지 않다면
2
장으로 건너뛰기
전에 이 장 끝에 있는 연습문제를 풀어보세요.
1.1
머신러닝이란?
머신러닝은 데이터에서부터 학습하도록 컴퓨터를 프로그래밍하는 과학 (또는 예술 )입니다.
조금 더 일반적인 정의는 다음과 같습니다.
[머신러닝은] 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.
_아서 새뮤얼
Arthur Samuel
,
1959
조금 더 공학적인 정의는 다음과 같습니다.
어떤 작업
T
에 대한 컴퓨터 프로그램의 성능을
P
로 측정했을 때 경험
E
로 인해 성능이 향상됐다
면, 이 컴퓨터 프로그램은 작업
T
와 성능 측정
P
에 대해 경험
E
로 학습한 것이다.
_톰 미첼
Tom Mitchell
,
1997
스팸 필터는 (사용자가 스팸이라고 지정한 ) 스팸 메일과 일반 메일의 샘플을 이용해 스팸 메일
구분법을 배울 수 있는 머신러닝 프로그램입니다. 시스템이 학습하는 데 ...