Skip to Content
파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서
book

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

by 박해선, 안드레아스 뮐러, 세라 가이도
April 2019
Beginner to intermediate
480 pages
12h 34m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서
3
비지도 학습과 데이터 전처리
177
3.3
데이터 전처리와 스케일 조정
앞 장에서 본 신경망과
SVM
같은 알고리즘은 데이터의 스케일에 매우 민감합니다. 그래서 보
통 이런 알고리즘들에 맞게 데이터의 특성 값을 조정합니다. 보통 특성마다 스케일을 조정해서
데이터를 변경합니다. 간단한 예를 준비했습니다 (그림
3
-
1
).
In [3]:
mglearn.plots.plot_scaling()
그림
3-1
데이터셋의 스케일을 조정하거나 전처리하는 여러 방법
3.3.1
여러 가지 전처리 방법
[그림
3
-
1
]의 첫 번째 그래프는 두 개의 특성을 인위적으로 만든 이진 분류 데이터셋입니다.
첫 번째 특성 (
x
축의 값 )
10
15
사이에 있습니다. 두 번째 특성 (
y
축의 값 )
1
9
사이
에 있습니다.
오른쪽의 네 그래프는 데이터를 기준이 되는 범위로 변환하는 네 가지 방법을 보여줍니다.
scikit
-
learn
StandardScaler
는 각 특성의 평균을
0
, 분산을
1
로 변경하여 모든 특성
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

이준용, 피터 브루스, 앤드루 브루스

Publisher Resources

ISBN: 9791162241646