최근 통계학 분야는 회귀나 분류와 같은 예측 모델링을 자동화하기 위한 더 강력한 기술을 개
발하는 것에 집중해왔다. 이러한 방법들은
통계적 머신러닝
statistical
machine
learning
이라는 큰 틀 안에
속하며, 데이터에 기반하며 전체적인 구조(예를 들어 모델이 선형인지)를 가정하지 않는다는
점에서 고전적인 통계 방법과 구별된다. 예를 들면
K
최근접 이웃 방법은 아주 간단하다. 비슷
한 레코드들이 어떻게 분류되는지에 따라 해당 레코드를 분류하는 방법이다.
앙상블 학습
ensemble
learning
을 적용한
의사 결정 트리
decision
tree
가
지금까지는
가장 성공적이고 널리 사용되는 기술이
다. 앙상블 학습의 기본 아이디어는 단일 모델로부터 결과를 얻는 것이 아니라 최종 예측을 얻
기 위해 많은 모델을 사용하는 것이다. 의사 결정 트리는 예측변수와 결과변수 사이의 관계 규
칙을 학습하는 유연하고 자동화된 기술이다. 앙상블 학습과 의사 결정 나무를 결합하는 방식은
최고의 성능을 얻을 수 있는 예측 모델링 기법이다.
UC
버클리의 통계학자 레오 브레이먼(그림
6
-
1
)과 스탠퍼
드 대학교의 제리 프리드먼은 통계적 머신러닝의 많은 기술
개발을 이끌었다. 이들의 연구는 버클리와 스탠퍼드의 다른
연구자들과 함께한
1984 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.