
125
CHAPTER 03
기술 인터뷰: 머신러닝 알고리즘
지도 학습 요약
레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터에 대한 개념을 기반으로 지도 학
습에 대해 살펴보겠습니다. 지도 학습은 레이블이 지정된 데이터 사용을 특징으로 하는 머신
러닝의 첫 번째 유형입니다. 과거에 만들어진 정확한 데이터를 바탕으로 새로운 데이터 포인
트 또는 미래의 데이터 포인트에 대한 종속변수를 예측합니다. 사과의 무게와 품종 등을 활
용해 새 사과의 판매 가격을 예측하는 것도 지도 학습의 한 예입니다. 지도 학습은 주로 회귀
와 분류, 크게 이 두 가지 범주로 나뉩니다.
지도 학습 비지도 학습
회귀 클러스트링
분류 차원 축소
강화 학습
그림
3-6
머신 러닝 분류 개요(이해를 돕기 위해 단순화한 버전)
회귀
Regression
에서 종속/출력변수는 연속적인 값입니다. 예를 들어, 주가, 주택 가격 또는 날씨
(기온 )를 예측하면 연속적인 값으로 결과를 생성합니다. 분류
Classification
는 종속/출력변수가
범주형이며, 예를 들어 ‘이것은 개’ 또는 ‘이것은 고양이’와 같은 범주로 그 결과가 출력됩니
다. 분류의 예로는 스팸 탐지, 사진 속 동물 종류 태깅과 같은 이미지 인식 등이 있습니다.
원-핫 인코딩
one
-
hot
encoding
같은 기법을 이용하면 범주형 데이터와