-평균 모델의 군집 수를 평가하기 위해 다음의 측정 항목을 살펴본다. 이 두 가지 측정 항
목을 가져오는 파이썬 코드는 실전 문제
1
의 코드와 동일하다.
1
오차 제곱합(
SSE
)
2
실루엣 점수
출력:
군집 내 오차 제곱합(
SSE
)
출력:
실루엣 점수
312
3
부
비지도 학습
앞의 두 차트를 모두 살펴보면, 최적의 군집 수는 약
7
인 것 같다. 군집 수가
6
개를 넘어 증
가함에 따라 군집 내의
SSE
가 정체되기 시작한다. 두 번째 그래프에서 그래프의 여러 부분
이 꼬임을 볼 수 있다.
7
개 군집 이후
SSE
에 큰 차이가 없으므로 아래의
k
-평균 모델에서
7
개 군집을 사용해 진행한다.
5
.
1
.
2
군집화와 시각화
7
개의 군집이 있는
k
-평균 모델을 만들어 보자.
nclust=7
# k-평균으로의 적합화
k_means = cluster.KMeans(n_clusters=nclust)
k_means.fit(X)
데이터셋의 각 개인에게 대상 군집을 할당한다. 각 군집의 행태를 이해하기 위한 탐색적 데
이터 분석을 위해 할당을 추가로 사용한다. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.