
229
6
장
결정 트리
SVM
처럼
결정 트리
decision
tree
는 분류와 회귀 작업 그리고 다중출력 작업도 가능한 다재다능
한 머신러닝 알고리즘입니다. 또한 매우 복잡한 데이터셋도 학습할 수 있는 강력한 알고리
즘입니다. 예를 들어
2
장에서 캘리포니아 주택 가격 데이터셋을 완벽하게 맞추는
Decision
TreeRegressor
모델을 훈련시켰습니다 (사실 과대적합입니다 ).
결정 트리는 최근에 자주 사용되는 가장 강력한 머신러닝 알고리즘 중 하나인 랜덤 포레스트 (
7
장 참조 )의 기본 구성 요소이기도 합니다.
이 장에서는 결정 트리의 훈련, 시각화, 예측 방법에 대해 먼저 살펴보겠습니다. 그런 다음 사이
킷런의
CART
훈련 알고리즘을 둘러보고 트리에 규제를 가하는 방법과 회귀 문제에 적용하는
방법을 배우도록 하겠습니다. 마지막으로 결정 트리의 제약 사항에 관해 이야기하겠습니다.
6.1
결정 트리 학습과 시각화
결정 트리를 이해하기 위해 모델 하나를 만들어서 어떻게 예측을 하는지 살펴보겠습니다. 다음
은 붓꽃 데이터셋 (
4
장 참조 )에
DecisionTreeClassifier
를 훈련시키는 코드입니다.
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
결정 ...