
R
478
13장 고급 수치 연산과 통계
13.4
변수가 여러 개인 데이터세트에서 주성분을 알아내고 싶다.
prcomp
함수를 사용한다. 첫 인자는 우변에는 변수들이 플러스 부호로 구분되어 있
고 좌변은 비어 있는 식을 사용한다.
r <- prcomp( ~ x + y + z)
summary(r)
#> Importance of components:
#> PC1 PC2 PC3
#> Standard deviation 1.894 0.11821 0.04459
#> Proportion of Variance 0.996 0.00388 0.00055
#> Cumulative Proportion 0.996 0.99945 1.00000
R
의 기본 배포판에는 주성분 분석 관련 함수가 두 개, 즉
prcomp
와
princomp
가 들어
있다.
prcomp
가 더 나은 수치형 속성을 가지고 있다고 문서에 쓰여 있으니, 여기에서
는 그 함수를 쓰도록 하겠다.
주성분 분석(
principle
components
analysis
,
PCA
)은 데이터세트의 차원수
(
demensionality
)를 줄일 때 많이 사용한다. 여러분의 데이터에
N
개의 많은 변수가
들어 있다고 해 보자. 이상적으로, 모든 변수는 어느 정도 독립적이고 동일한 분량
의 기여를 해야 한다. 하지만 어떤 변수들이 ...