429
14
장
결론
다. 현실 세계 데이터 대부분은 레이블이 없습니다. 지도 학습이 이미 해결한 과제보다 더 큰
규모의 과제에 머신러닝을 적용하기 위해서는 레이블이 있는 데이터와 레이블이 없는 데이터
를 모두 사용해야 합니다.
비지도 학습은 레이블이 없는 데이터의 내재된 구조를 학습해 숨겨진 패턴을 찾는 데 매우 유
용합니다. 숨겨진 패턴이 발견되면 이 패턴을 유사한 패턴들과 함께 그룹화할 수 있습니다.
일단 패턴이 이런 식으로 그룹화되면 담당자는 그룹당 몇 가지 패턴을 샘플링하고 의미 있는
레이블을 제공할 수 있습니다. 그룹이 잘 정의된 경우 (즉, 같은 그룹의 구성원들은 동질하고
다른 그룹의 구성원과는 뚜렷하게 다른 경우 ), 담당자의 수작업으로 제공하는 몇 가지 레이블
을 그룹의 다른 (아직 레이블이 없는) 구성원에게 적용할 수 있습니다. 이 프로세스를 통해 이
전에 레이블이 없던 데이터에 매우 빠르고 효율적으로 레이블을 지정할 수 있습니다.
즉, 비지도 학습은 지도 학습 방법의 성공적인 적용을 가능하게 합니다. 비지도 학습과 지도 학
습 사이의 시너지(준지도 학습이라고도 함)는 성공적인 머신러닝 응용 프로그램의 미래를 이
끌 겁니다.
14.2.1
사이킷런
이제는 이러한 비지도 학습 주제들이 매우 친숙할 겁니다. 그러나 복습하는 의미에서 지금까지
다룬 모든 내용을 간단히 살펴보겠습니다.
3
장에서 우리는 차원 감소 알고리즘을 사용해 데이터의 내재된 구조를 학습하고 가장 핵심적
인 피처만 유지하며, 더 낮은 차원 공간에 피처를 매핑함으로써 데이터의 ...