
40
1
부
머신러닝
알고리즘으로 두 특성을 차의 마모 정도를 나타내는 하나의 특성으로 합칠 수 있습니다. 이를
특성 추출
feature
extraction
이라고 합니다.
TIP
(지도 학습 알고리즘 같은) 머신러닝 알고리즘에 데이터를 주입하기 전에 차원 축소 알고리즘을 사용하여 훈련
데이터의 차원을 줄이는 것이 유용할 때가 많습니다. 실행 속도가 훨씬 빨라지고 디스크와 메모리를 차지하는
공간도 줄고 경우에 따라 성능이 좋아지기도 합니다.
고양이
승용차
트럭
개구리
배
비행기
말
새
개
사슴
승용차
트럭
새
고양이
개
사슴
말
비행기
개구리
배
그림
1-9
의미 있는 군집을 강조한
t
-
SNE
시각화의 예
8
또 하나의 중요한 비지도 학습은
이상치 탐지
outlier
detection
입니다. 예를 들어 부정 거래를 막기 위
해 이상한 신용카드 거래를 감지하고, 제조 결함을 잡아내고, 학습 알고리즘에 주입하기 전에
데이터셋에서 이상한 값을 자동으로 제거하는 것 등입니다. 시스템은 훈련하는 동안 대부분 정
상 샘플을 만나 이를 인식하도록 훈련됩니다. 그다음 새로운 샘플을 보고 정상 데이터인지 혹
은 이상치인지 판단합니다 (그림
1
-
10
). 매우 비슷한 작업으로
특이치 탐지
novelty
detection
가 있습
니다. 훈련 세트에 있는 모든 샘플과 달라 보이는 새로운 샘플을 탐지하는 것이 목적입니다. ...