book

핸즈온 머신러닝: 사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무

Name: 핸즈온 머신러닝: 사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무
ISBN: 9791162240731

by 박해선, 오렐리앙 제롱

May 2018

Beginner to intermediate

672 pages

16h 54m

Korean

Hanbit Media, Inc.

Read now

Unlock full access

핸즈온 머신러닝
지은이·옮긴이 소개
추천의 글
옮긴이의 말
이 책에 대하여 (1/2)
이 책에 대하여 (2/2)
감사의 글
CONTENTS (1/3)
CONTENTS (2/3)
CONTENTS (3/3)

1부 머신러닝
1장 한눈에 보는 머신러닝
1.1 머신러닝이란?
1.2 왜 머신러닝을 사용하는가?
1.3 머신러닝 시스템의 종류 (1/4)
1.3.1 지도 학습과 비지도 학습
1.3 머신러닝 시스템의 종류 (2/4)
1.3.2 배치 학습과 온라인 학습
1.3 머신러닝 시스템의 종류 (3/4)
1.3.3 사례 기반 학습과 모델 기반 학습
1.3 머신러닝 시스템의 종류 (4/4)
1.4 머신러닝의 주요 도전 과제 (1/2)
1.4.1 충분하지 않은 양의 훈련 데이터1.4.2 대표성 없는 훈련 데이터1.4.3 낮은 품질의 데이터1.4.4 관련 없는 특성1.4.5 훈련 데이터 과대적합
1.4 머신러닝의 주요 도전 과제 (2/2)
1.4.6 훈련 데이터 과소적합
1.4.7 한걸음 물러서서
1.5 테스트와 검증
1.6 연습문제
2장 머신러닝 프로젝트 처음부터 끝까지
2.1 실제 데이터로 작업하기
2.2 큰 그림 보기 (1/2)
2.2.1 문제 정의2.2.2 성능 측정 지표 선택
2.2 큰 그림 보기 (2/2)
2.2.3 가정 검사
2.3 데이터 가져오기 (1/3)
2.3.1 작업환경 만들기2.3.2 데이터 다운로드
2.3 데이터 가져오기 (2/3)
2.3.3 데이터 구조 훑어보기
2.3 데이터 가져오기 (3/3)
2.3.4 테스트 세트 만들기
2.4 데이터 이해를 위한 탐색과 시각화 (1/2)
2.4.1 지리적 데이터 시각화2.4.2 상관관계 조사
2.4 데이터 이해를 위한 탐색과 시각화 (2/2)
2.4.3 특성 조합으로 실험
2.5 머신러닝 알고리즘을 위한 데이터 준비 (1/3)
2.5.1 데이터 정제2.5.2 텍스트와 범주형 특성 다루기
2.5 머신러닝 알고리즘을 위한 데이터 준비 (2/3)
2.5.3 나만의 변환기2.5.4 특성 스케일링2.5.5 변환 파이프라인
2.5 머신러닝 알고리즘을 위한 데이터 준비 (3/3)
2.6 모델 선택과 훈련
2.6.1 훈련 세트에서 훈련하고 평가하기2.6.2 교차 검증을 사용한 평가
2.7 모델 세부 튜닝 (1/2)
2.7.1 그리드 탐색2.7.2 랜덤 탐색2.7.3 앙상블 방법2.7.4 최상의 모델과 오차 분석
2.7 모델 세부 튜닝 (2/2)
2.7.5 테스트 세트로 시스템 평가하기
2.8 론칭, 모니터링, 그리고 시스템 유지 보수
2.9 직접 해보세요!
2.10 연습문제
3장 분류
3.1 MNIST
3.2 이진 분류기 훈련
3.3 성능 측정 (1/3)
3.3.1 교차 검증을 사용한 정확도 측정3.3.2 오차 행렬
3.3 성능 측정 (2/3)
3.3.3 정밀도와 재현율3.3.4 정밀도/재현율 트레이드오프
3.3 성능 측정 (3/3)
3.3.5 ROC 곡선
3.4 다중 분류
3.5 에러 분석
3.6 다중 레이블 분류
3.7 다중 출력 분류
3.8 연습문제
4장 모델 훈련
4.1 선형 회귀
4.1.1 정규방정식4.1.2 계산 복잡도
4.2 경사 하강법 (1/3)
4.2.1 배치 경사 하강법
4.2 경사 하강법 (2/3)
4.2.2 확률적 경사 하강법
4.2 경사 하강법 (3/3)
4.2.3 미니배치 경사 하강법
4.3 다항 회귀
4.4 학습 곡선
4.5 규제가 있는 선형 모델 (1/2)
4.5.1 릿지 회귀4.5.2 라쏘 회귀
4.5 규제가 있는 선형 모델 (2/2)
4.5.3 엘라스틱넷4.5.4 조기 종료
4.6 로지스틱 회귀 (1/2)
4.6.1 확률 추정4.6.2 훈련과 비용 함수4.6.3 결정 경계
4.6 로지스틱 회귀 (2/2)
4.6.4 소프트맥스 회귀
4.7 연습문제
5장 서포트 벡터 머신
5.1 선형 SVM 분류5.1.1 소프트 마진 분류
5.2 비선형 SVM 분류 (1/2)
5.2.1 다항식 커널5.2.2 유사도 특성 추가5.2.3 가우시안 RBF 커널
5.2 비선형 SVM 분류 (2/2)
5.2.4 계산 복잡도
5.3 SVM 회귀
5.4 SVM 이론 (1/2)
5.4.1 결정 함수와 예측5.4.2 목적 함수5.4.3 콰드라틱 프로그래밍5.4.4 쌍대 문제
5.4 SVM 이론 (2/2)
5.4.5 커널 SVM5.4.6 온라인 SVM
5.5 연습문제
6장 결정 트리
6.1 결정 트리 학습과 시각화
6.2 예측하기
6.3 클래스 확률 추정
6.4 CART 훈련 알고리즘
6.5 계산 복잡도
6.6 지니 불순도 또는 엔트로피?
6.7 규제 매개변수
6.8 회귀
6.9 불안정성
6.10 연습문제
7장 앙상블 학습과 랜덤 포레스트
7.1 투표 기반 분류기
7.2 배깅과 페이스팅
7.2.1 사이킷런의 배깅과 페이스팅7.2.2 oob 평가
7.3 랜덤 패치와 랜덤 서브스페이스
7.4 랜덤 포레스트
7.4.1 엑스트라 트리7.4.2 특성 중요도
7.5 부스팅 (1/2)
7.5.1 아다부스트
7.5 부스팅 (2/2)
7.5.2 그래디언트 부스팅
7.6 스태킹
7.7 연습문제
8장 차원 축소
8.1 차원의 저주
8.2 차원 축소를 위한 접근 방법
8.2.1 투영8.2.2 매니폴드 학습
8.3 PCA (1/2)
8.3.1 분산 보존8.3.2 주성분8.3.3 d차원으로 투영하기8.3.4 사이킷런 사용하기8.3.5 설명된 분산의 비율
8.3 PCA (2/2)
8.3.6 적절한 차원 수 선택하기8.3.7 압축을 위한 PCA8.3.8 점진적 PCA8.3.9 랜덤 PCA
8.4 커널 PCA
8.4.1 커널 선택과 하이퍼파라미터 튜닝
8.5 LLE
8.6 다른 차원 축소 기법
8.7 연습문제
2부 신경망과 딥러닝
9장 텐서플로 시작하기
9.1 설치
9.2 첫 번째 계산 그래프를 만들어 세션에서 실행하기
9.3 계산 그래프 관리
9.4 노드 값의 생애주기
9.5 텐서플로를 이용한 선형 회귀
9.6 경사 하강법 구현
9.6.1 직접 그래디언트 계산9.6.2 자동 미분 사용
9.6.3 옵티마이저 사용
9.7 훈련 알고리즘에 데이터 주입
9.8 모델 저장과 복원
9.9 텐서보드로 그래프와 학습 곡선 시각화하기
9.10 이름 범위
9.11 모듈화
9.12 변수 공유
9.13 연습문제
10장 인공 신경망 소개
10.1 생물학적 뉴런에서 인공 뉴런까지 (1/3)
10.1.1 생물학적 뉴런10.1.2 뉴런을 사용한 논리 연산10.1.3 퍼셉트론
10.1 생물학적 뉴런에서 인공 뉴런까지 (2/3)
10.1.4 다층 퍼셉트론과 역전파
10.1 생물학적 뉴런에서 인공 뉴런까지 (3/3)
10.2 텐서플로의 고수준 API로 다층 퍼셉트론 훈련하기
10.3 텐서플로의 저수준 API로 심층 신경망 훈련하기 (1/2)
10.3.1 구성 단계
10.3 텐서플로의 저수준 API로 심층 신경망 훈련하기 (2/2)
10.3.2 실행 단계10.3.3 신경망 사용하기
10.4 신경망 하이퍼파라미터 튜닝하기
10.4.1 은닉층의 수10.4.2 은닉층의 뉴런 수10.4.3 활성화 함수
10.5 연습문제
11장 심층 신경망 훈련
11.1 그래디언트 소실과 폭주 문제 (1/3)
11.1.1 세이비어 초기화와 He 초기화11.1.2 수렴하지 않는 활성화 함수
11.1 그래디언트 소실과 폭주 문제 (2/3)
11.1.3 배치 정규화
11.1 그래디언트 소실과 폭주 문제 (3/3)
11.1.4 그래디언트 클리핑
11.2 미리 훈련된 층 재사용하기 (1/2)11.2.1 텐서플로 모델 재사용하기11.2.2 다른 프레임워크의 모델 재사용하기
11.2 미리 훈련된 층 재사용하기 (2/2)
11.2.3 신경망의 하위층을 학습에서 제외하기11.2.4 동결된 층 캐싱하기11.2.5 상위층을 변경, 삭제, 대체하기11.2.6 모델 저장소11.2.7 비지도 사전훈련11.2.8 보조 작업으로 사전훈련
11.3 고속 옵티마이저 (1/3)
11.3.1 모멘텀 최적화11.3.2 네스테로프 가속 경사11.3.3 AdaGrad
11.3 고속 옵티마이저 (2/3)
11.3.4 RMSProp11.3.5 Adam 최적화11.3.6 학습률 스케줄링
11.3 고속 옵티마이저 (3/3)
11.4 과대적합을 피하기 위한 규제 방법 (1/2)
11.4.1 조기 종료11.4.2 l1과 l2 규제11.4.3 드롭아웃
11.4 과대적합을 피하기 위한 규제 방법 (2/2)
11.4.4 맥스-노름 규제11.4.5 데이터 증식
11.5 실용적 가이드라인
11.6 연습문제
12장 다중 머신과 장치를 위한 분산 텐서플로
12.1 단일 머신의 다중 장치 (1/3)
12.1.1 설치12.1.2 GPU RAM 관리
12.1 단일 머신의 다중 장치 (2/3)
12.1.3 장치에 연산 배치하기12.1.4 병렬 실행
12.1 단일 머신의 다중 장치 (3/3)
12.1.5 제어 의존성
12.2 다중 머신의 다중 장치 (1/5)
12.2.1 세션 열기12.2.2 마스터와 워커 서비스12.2.3 여러 태스크에 연산 할당하기12.2.4 여러 대의 파라미터 서버에 변수를 나누어 분산하기
12.2 다중 머신의 다중 장치 (2/5)
12.2.5 리소스 컨테이너를 사용해 여러 세션에서 상태 공유하기12.2.6 텐서플로 큐를 사용한 비동기 통신
12.2 다중 머신의 다중 장치 (3/5)
12.2 다중 머신의 다중 장치 (4/5)
12.2.7 그래프에서 직접 데이터 로드하기
12.2 다중 머신의 다중 장치 (5/5)
12.3 텐서플로 클러스터에서 신경망 병렬화하기 (1/3)
12.3.1 장치마다 하나의 신경망12.3.2 그래프 내 복제와 그래프 간 복제
12.3 텐서플로 클러스터에서 신경망 병렬화하기 (2/3)
12.3.3 모델 병렬화12.3.4 데이터 병렬화
12.3 텐서플로 클러스터에서 신경망 병렬화하기 (3/3)
12.4 연습문제
13장 합성곱 신경망
13.1 시각 피질의 구조
13.2 합성곱층 (1/2)
13.2.1 필터13.2.2 여러 개의 특성 맵 쌓기
13.2 합성곱층 (2/2)
13.2.3 텐서플로 구현13.2.4 메모리 요구사항
13.3 풀링층
13.4 CNN 구조 (1/3)
13.4.1 LeNet-513.4.2 AlexNet
13.4 CNN 구조 (2/3)
13.4.3 GoogLeNet13.4.4 ResNet
13.4 CNN 구조 (3/3)
13.5 연습문제
14장 순환 신경망
14.1 순환 뉴런
14.1.1 메모리 셀14.1.2 입력과 출력 시퀀스
14.2 텐서플로로 기본 RNN 구성하기 (1/2)
14.2.1 정적으로 타임 스텝 펼치기
14.2 텐서플로로 기본 RNN 구성하기 (2/2)
14.2.2 동적으로 타임 스텝 펼치기14.2.3 가변 길이 입력 시퀀스 다루기
14.2.4 가변 길이 출력 시퀀스 다루기
14.3 RNN 훈련하기 (1/3)14.3.1 시퀀스 분류기 훈련하기14.3.2 시계열 예측을 위해 훈련하기
14.3 RNN 훈련하기 (2/3)
14.3 RNN 훈련하기 (3/3)
14.3.3 RNN의 창조성
14.4 심층 RNN
14.4.1 여러 GPU에 심층 RNN 분산하기14.4.2 드롭아웃 적용하기14.4.3 많은 타임 스텝에서 훈련의 어려움
14.5 LSTM 셀
14.5.1 핍홀 연결
14.6 GRU 셀
14.7 자연어 처리
14.7.1 워드 임베딩14.7.2 기계 번역을 위한 인코더-디코더 네트워크
14.8 연습문제
15장 오토인코더
15.1 효율적인 데이터 표현
15.2 과소완전 선형 오토인코더로 PCA 수행하기
15.3 적층 오토인코더 (1/2)
15.3.1 텐서플로 구현15.3.2 가중치 묶기15.3.3 한 번에 한 층씩 훈련하기
15.3 적층 오토인코더 (2/2)
15.3.4 재구성 시각화15.3.5 특성 시각화
15.4 적층 오토인코더를 사용한 비지도 사전훈련
15.5 잡음제거 오토인코더
15.5.1 텐서플로 구현
15.6 희소 오토인코더
15.6.1 텐서플로 구현
15.7 변이형 오토인코더
15.7.1 숫자 이미지 생성
15.8 다른 오토인코더들
15.9 연습문제
16장 강화 학습
16.1 보상을 최적화하기 위한 학습
16.2 정책 탐색
16.3 OpenAI 짐
16.4 신경망 정책
16.5 행동 평가: 신용 할당 문제
16.6 정책 그래디언트 (1/2)
16.6 정책 그래디언트 (2/2)
16.7 마르코프 결정 과정
16.8 시간차 학습과 Q-러닝
16.8.1 탐험 정책16.8.2 근사 Q-러닝과 딥 Q-러닝
16.9 DQN 알고리즘으로 미스 팩맨 플레이 학습하기 (1/2)
16.9 DQN 알고리즘으로 미스 팩맨 플레이 학습하기 (2/2)
16.10 연습문제
감사합니다!
3부 부록
부록 A 연습문제 정답
1장: 한눈에 보는 머신러닝
2장: 머신러닝 프로젝트 처음부터 끝까지
3장: 분류4장: 모델 훈련
5장: 서포트 벡터 머신
6장: 결정 트리
7장: 앙상블 학습과 랜덤 포레스트
8장: 차원 축소
9장: 텐서플로 시작하기
10장: 인공 신경망 소개
11장: 심층 신경망 훈련
12장: 다중 머신과 장치를 위한 분산 텐서플로
13장: 합성곱 신경망
14장: 순환 신경망
15장: 오토인코더
16장: 강화 학습
부록 B 머신러닝 프로젝트 체크리스트
B.1 문제를 정의하고 큰 그림을 그립니다
B.2 데이터를 수집합니다
B.3 데이터를 탐색합니다
B.4 데이터를 준비합니다
B.5 가능성 있는 몇 개의 모델을 고릅니다
B.6 시스템을 세밀하게 튜닝합니다
B.7 솔루션을 출시합니다
B.8 시스템을 론칭합니다!
부록 C SVM 쌍대 문제
부록 D 자동 미분
D.1 수동 미분
D.2 기호 미분
D.3 수치 미분
D.4 전진 모드 자동 미분
D.5 후진 모드 자동 미분
무록 E 유명한 다른 인공 신경망 구조
E.1 홉필드 네트워크
E.2 볼츠만 머신
E.3 제한된 볼츠만 머신
E.4 심층 신뢰 신경망
E.5 자기 조직화 지도
찾아보기 (1/4)
찾아보기 (2/4)
찾아보기 (3/4)
찾아보기 (4/4)

Content preview from 핸즈온 머신러닝: 사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무

233

장

결정 트리

6.7

규제 매개변수

결정 트리는 훈련 데이터에 대한 제약사항이 거의 없습니다(반대로 선형 모델은 데이터가 꼭 선

형일 거라 가정합니다 ). 제한을 두지 않으면 트리가 훈련 데이터에 아주 가깝게 맞추려고 해서 대

부분 과대적합되기 쉽습니다. 결정 트리는 모델 파라미터가 전혀 없는 것이 아니라 (보통 많습니

다) 훈련되기 전에 파라미터 수가 결정되지 않기 때문에 이런 모델을 비파라미터 모델

nonparametric

model

이라고 부르곤 합니다. 그래서 모델 구조가 데이터에 맞춰져서 고정되지 않고 자유롭습니

다. 반대로 선형 모델 같은 파라미터 모델

parametric

model

은 미리 정의된 모델 파라미터 수를 가지

므로 자유도가 제한되고 과대적합될 위험이 줄어듭니다(하지만 과소적합될 위험은 커집니다).

훈련 데이터에 대한 과대적합을 피하기 위해 학습할 때 결정 트리의 자유도를 제한할 필요가 있

습니다. 이미 알고 있듯이 이를 규제라고 합니다. 규제 매개변수는 사용하는 알고리즘에 따라 다

르지만, 보통 적어도 결정 트리의 최대 깊이는 제어할 수 있습니다. 사이킷런에서는

max

depth

매개변수로 이를 조절합니다 (기본값은 제한이 없는 것을 의미하는

None

입니다 ).

max

depth

를

줄이면 모델을 규제하게 되고 과대적합의 위험이 감소합니다. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

핸즈온 머신러닝(2판): 사이킷런, 케라스, 텐서플로 2를 활용한 머신러닝, 딥러닝 완벽 실무

Publisher Resources

ISBN: 9791162240731

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

핸즈온 머신러닝: 사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무

by 박해선, 오렐리앙 제롱

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

핸즈온 머신러닝(2판): 사이킷런, 케라스, 텐서플로 2를 활용한 머신러닝, 딥러닝 완벽 실무

긱 아틀라스: 과학과 기술의 발상지 129곳

코드로 인프라 관리하기: 효율적인 인프라 관리를 위한 자동화 방법

머신러닝 파워드 애플리케이션: 아이디어에서부터 완성된 제품까지, 강력한 머신러닝 애플리케이션 구축 과정 배우기

Publisher Resources