Skip to Content
데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스
October 2018
Beginner to intermediate
328 pages
7h 58m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념
211
5
분류
5.3.1
로지스틱 반응 함수와 로짓
핵심 구성 요소는
로지스틱 반응 함수
logistic
response
function
로짓
이다. 여기서 우리는 확률 (
0
에서
1
사이의 단위 )을 선형 모델링에 적합한 더 확장된 단위로 매핑한다.
첫 번째 단계에서, 결과변수를 이진값으로 생각하기보다 라벨이 ‘
1
’이 될 확률
p
로 생각해보자.
당연히
p
를 다음과 같이 예측변수들의 선형함수로 모델링하고 싶은 유혹이 있을 것이다.
ββ β β
= + + ++
0 11 2 2
qq
p xx x
그러나 이 모델을 피팅한다고 해도, 당연히 선형모델이다 보니
p
0
1
사이로 딱 떨어지지
않을 수 있다. 더 이상 확률이라고 할 수 없게 된다.
대신, 예측변수에
로지스틱 반응
혹은
역 로짓
함수라는 것을 적용해서
p
를 모델링한다.
ββ β β
+ + ++
=
+
0 11 22
()
1
1
qq
xx x
p
e
이 변환을 통해 우리는
p
가 항상
0
에서
1
사이에 오도록 할 수 있다.
분모의 지수 부분을 구하려면 확률 대신
오즈비
를 이용한다. 어딜 가나 내기 좋아하는 사람들에
게 친숙한 오즈비는 ‘성공’ (
1
)과 ‘실패’ (
0
)의 비율을 말한다. 확률의 관점에서, 오즈비는 사건
이 발생할 확률을 사건이 발생하지 않을 확률로 나눈 비율이다. 예를 들면 어떤 말이 이길 확률
0
.
5
라면 ‘이기지 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

Publisher Resources

ISBN: 9791162240984