Skip to Content
데이터 과학을 위한 통계(2판)
book

데이터 과학을 위한 통계(2판)

by 이준용, 피터 브루스, 앤드루 브루스, 피터 게데크
May 2021
Beginner to intermediate
380 pages
9h 22m
Korean
Hanbit Media, Inc.
Content preview from 데이터 과학을 위한 통계(2판)
254
데이터 과학을 위한 통계
에 대한 자세한 설명은
5
.
4
.
3
절을 참고하자). 대출 데이터의 예제에서 보았듯, 실제 응답변수
는 행을 따라, 그리고 예측 응답변수는 열을 따라 표시된다 (행과 열의 의미를 바꾸어 사용하
는 경우도 종종 있다). 대각 방향의 칸(왼쪽 상단, 오른쪽 하단 )은 예측변수
ˆ
Y
이 정확한 값을
예측하는 경우의 수를 의미한다. 여기서 눈에 띄지 않지만 중요한 지표 중 하나는
거짓 양성 비
false
positive
ratio
이다. 결과가
1
인 데이터의 수가 희박할 때, 모든 예측 응답변수에 대해 거짓 양
성 값의 비율이 높아져, 예측 결과는
1
이지만 실제로는
0
일 가능성이 높은 상황이 된다. 이 문
제는 광범위하게 적용되는 의료 검진 검사 (예를 들면 유방 조영술)를 어렵게 하는 요인이다.
상대적으로 발생하는 비율이 드물기 때문에, 검사 결과가 양성으로 나왔다고 해서 그것이 바로
유방암을 의미하지는 않는다. 이러한 점들이 대중에 혼동을 가져다줄 수 있다.
그림
5-5
이진 응답변수에 대한 혼동행렬과 그에 관련된 다른 지표들
NOTE
_
여기에서는 행을 따라 실제 응답을 표시하고 열을 따라 예측 응답을 표시하고 있다. 하지만 이것을
반대로 표시하는 경우도 있다. 주목할 만한 예는 유명한
R
패키지
caret
이다.
5.4.2
희귀 클래스 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

데이터 엔지니어를 위한 97가지 조언

데이터 엔지니어를 위한 97가지 조언

Tobias Macey, 임혜연(Lim Hye Yeon)
파이썬으로 살펴보는 아키텍처 패턴

파이썬으로 살펴보는 아키텍처 패턴

오현석, 해리 퍼시벌, 밥 그레고리

Publisher Resources

ISBN: 9791162244180