book

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

by 이준용, 피터 브루스, 앤드루 브루스

October 2018

Beginner to intermediate

328 pages

7h 58m

Korean

Hanbit Media, Inc.

Read now

Unlock full access

Content preview from 데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

205

장

분류

주요 개념

• 나이브 베이즈는 예측변수와 결과변수 모두 범주형 (요인 )이어야 한다.

• ‘각 출력 카테고리 안에서, 어떤 예측변수의 카테고리가 가장 가능성이 높은가?’가 답하고자 하는 질문이다.

• 그리고 이 정보는 주어진 예측변수 값에 대해, 결과 카테고리의 확률을 추정하는 것으로 바뀐다.

5.1.4

더 읽을 거리

• 트레버 헤이스티, 로버트 팁시라니, 제롬 프리드먼의 『

The

Elements

Statistical

Learning

2nd

.』

(

Springer

2009

• 갈리트 시뮤엘리, 피터 브루스, 니틴 파텔이 쓴 『비즈니스 애널리틱스를 위한 데이터마이닝 (제

판)』(이앤비플

러스,

2017

)에서 나이브 베이즈 관련 챕터를 참고하자.

5.2

판별분석

discriminant

analysis

은 초창기의 통계 분류 방법이다.

1936

년 『

Annals

Eugenics

』 저널

에 실린 로널드 피셔의 논문을 통해 소개되었다.

용어 정리

•

공분산

covariance

: 하나의 변수가 다른 변수와 함께 변화하는 정도 (유사한 크기와 방향 )를 측정하는 지표

•

판별함수

discriminant

function

: 예측변수에 적용했을 때, 클래스 구분을 최대화하는 함수

•

판별 가중치

discriminant

weight

: 판별함수를 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

파이썬 라이브러리를 활용한 머신러닝(번역개정판): 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

박해선, 안드레아스 뮐러, 세라 가이도

파이썬 라이브러리를 활용한 데이터 분석(2판): 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

김영근, 웨스 맥키니

스파크를 활용한 실시간 처리: 실시간 데이터 처리를 위한 고수준 스트리밍 API 마스터하기

김인범, 제러드 마스, 프랑수아 가릴로

자바로 배우는 핵심 자료구조와 알고리즘: 기술 면접에 필요한 실용주의 자료구조와 알고리즘

유동환, 앨런 B. 다우니

Publisher Resources

ISBN: 9791162240984