book

핸즈온 비지도 학습

by 강재원, 권재철, 안쿠르 A. 파텔

July 2020

Beginner to intermediate

444 pages

10h 50m

Korean

Hanbit Media, Inc.

Read now

Unlock full access

CONTENTS
옮긴이의 글 (4/4)추천의 글 (4/4)베타리더의 한마디 (3/4)
지은이·옮긴이 소개 (1/4)
지은이·옮긴이 소개 (2/4)
옮긴이의 글 (1/4)추천의 글 (1/4)
지은이·옮긴이 소개 (3/4)
옮긴이의 글 (2/4)추천의 글 (2/4)베타리더의 한마디 (1/4)
지은이·옮긴이 소개 (4/4)
옮긴이의 글 (3/4)추천의 글 (3/4)베타리더의 한마디 (2/4)
베타리더의 한마디 (4/4)
서문
0.1 머신러닝의 역사
0.2 인공지능의 귀환, 왜 지금인가?
0.3 응용 인공지능의 출현
0.4 지난 20년간 응용 인공지능 주요 성과

0.5 좁은 인공지능부터 범용 인공지능까지
0.6 목표와 접근방식
0.7 이 책의 구성
0.8 예제 다운로드 안내
비지도 학습 개요
머신러닝 생태계와 비지도 학습
1.1 머신러닝 기본 용어 이해하기
1.2 규칙 기반과 머신러닝 비교하기
1.3 지도 학습과 비지도 학습 비교하기
1.3.1 지도 학습의 강점과 약점
1.3.2 비지도 학습의 강점과 약점
1.4 비지도 학습을 사용해 머신러닝 솔루션 개선하기
1.5 지도 학습 알고리즘 자세히 살펴보기
1.5.1 선형 방법
1.5.2 이웃 기반 방법
1.5.3 트리 기반 방법
1.5.4 SVM
1.5.5 신경망
1.6 비지도 학습 알고리즘 자세히 살펴보기
1.6.1 차원 축소
1.6.2 클러스터링
1.6.3 피처 추출
1.6.4 비지도 딥러닝
1.6.5 비지도 학습을 사용해 순차 데이터 문제 해결
1.7 비지도 학습을 활용한 강화 학습
1.8 준지도 학습
1.9 비지도 학습의 성공적인 응용 사례1.9.1 이상치 탐지
1.9.2 그룹 세분화
1.10 마치며
머신러닝 프로젝트 A to Z
2.1 환경 설정2.1.1 버전 관리: 깃
2.1.2 핸즈온 비지도 학습의 깃 리포지터리 복제
2.1.3 데이터 과학 라이브러리: 파이썬 아나콘다 배포판
2.1.4 신경망: 텐서플로와 케라스
2.1.5 그레이디언트 부스팅, 버전 1: XGBoost
2.1.6 그레이디언트 부스팅, 버전 2: LightGBM
2.1.7 클러스터링 알고리즘
2.1.8 대화형 컴퓨팅 환경: 주피터 노트북
2.2 데이터 개요
2.3 데이터 준비하기
2.3.1 데이터 획득하기
2.3.2 데이터 탐색하기
2.3.3 피처 행렬 및 레이블 배열 생성하기
2.3.4 피처 엔지니어링 및 피처 선택하기
2.3.5 데이터 시각화하기
2.4 모델 준비하기
2.4.1 훈련 및 테스트 데이터셋으로 분할하기
2.4.2 비용 함수 선택하기
2.4.3 k-겹 교차검증 데이터셋 생성하기
2.5 머신러닝 모델(1)
2.5.1 모델 #1: 로지스틱 회귀 분석
2.6 평가 지표
2.6.1 오차 행렬
2.6.2 정밀도-재현율 곡선
2.6.3 수신자 조작 특성
2.7. 머신러닝 모델(2)
2.7.1 모델 #2: 랜덤 포레스트
2.7.2 모델 #3: 그레이디언트 부스팅 머신(XGBoost)
2.7.3 모델 #4: 그레이디언트 부스팅 머신(LightGBM)
2.8 테스트 데이터셋으로 4가지 모델 평가하기 (1/2)
2.8 테스트 데이터셋으로 4가지 모델 평가하기 (2/2)
2.9 앙상블
2.9.1 스태킹
2.10 최종 모델 선택하기
2.11 프로덕션 파이프라인
2.12 마치며
사이킷런을 사용한 비지도 학습 모델
차원 축소
3.1 차원 축소에 대한 동기 부여
3.1.1 MNIST 숫자 데이터베이스
3.2 차원 축소 알고리즘
3.2.1 선형 투영 vs 매니폴드 학습
3.3 PCA
3.3.1 PCA 개요
3.3.2 PCA 실전 예제
3.3.3 점진적 PCA
3.3.4 희소 PCA
3.3.5 커널 PCA
3.4 SVD
3.5 랜덤 투영
3.5.1 GRP
3.5.2 SRP
3.6 Isomap
3.7 MDS
3.8 LLE
3.9 t-SNE
3.10 사전 학습
3.11 ICA
3.12 마치며
이상치 탐지
4.1 신용카드 사기 탐지
4.1.1 데이터 준비하기
4.1.2 이상치 스코어 함수 정의하기
4.1.3 평가 지표 정의하기
4.1.4 시각화 함수 정의하기
4.2 일반 PCA를 활용한 이상치 탐지
4.2.1 원본 차원의 수와 동일한 PCA 주성분 수
4.2.2 최적의 주성분 개수 찾기
4.3 희소 PCA를 활용한 이상치 탐지
4.4 커널 PCA를 활용한 이상치 탐지
4.5 GRP를 활용한 이상치 탐지
4.6 SRP를 활용한 이상치 탐지
4.7 비선형 이상치 탐지
4.8 사전 학습을 활용한 이상치 탐지
4.9 ICA를 활용한 이상치 탐지
4.10 테스트셋으로 이상치 탐지 성능 평가
4.10.1 테스트셋으로 일반 PCA의 이상치 탐지 성능 평가하기
4.10.2 테스트셋으로 ICA의 이상치 탐지 성능 평가하기
4.10.3 테스트셋으로 사전 학습의 이상치 탐지 성능 평가하기
4.11 마치며
클러스터링
5.1 MNIST 데이터셋
5.1.1 데이터 준비하기
5.2 클러스터링 알고리즘
5.3 k-평균
5.3.1 k-평균 관성
5.3.2 클러스터링 결과 평가하기
5.3.3 k-평균 정확도
5.3.4 k-평균과 주성분 개수
5.3.5 원본 데이터셋에서 k-평균 실행하기
5.4 계층적 클러스터링
5.4.1 병합 계층적 클러스터링
5.4.2 덴드로그램
5.4.3 클러스터링 결과 평가하기
5.5 DBSCAN 개요
5.5.1 DBSCAN
5.5.2 MNIST 데이터셋에 DBSCAN 적용하기
5.3.3 HDBSCAN
5.6 마치며
그룹 세분화
6.1 랜딩 클럽 데이터
6.1.1 데이터 준비하기
6.1.2 문자형을 숫자형으로 변환하기
6.1.3 결측값 대체하기
6.1.4 피처 엔지니어
6.1.5 최종 피처셋을 선택하고 스케일링하기
6.1.6 평가를 위한 레이블 정의하기
6.2 군집 적합도 검정
6.3 k-평균 클러스터링 응용 프로그램
6.4 계층적 클러스터링 응용 프로그램
6.5 HDBSCAN 응용 프로그램
6.6 마치며
텐서플로와 케라스를 사용한 비지도 학습 모델
오토인코더
7.1 신경망
7.1.1 텐서플로
7.1.2 케라스
7.2 오토인코더: 인코더와 디코더
7.3 과소완전 오토인코더
7.4 과대완전 오토인코더
7.5 고밀도 vs 희소 오토인코더
7.6 노이즈 제거 오토인코더
7.7 변분 오토인코더
7.8 마치며
핸즈온 오토인코더
8.1 데이터 준비
8.2 오토인코더의 구성 요소
8.3 활성화 함수
8.4 첫 번째 오토인코더
8.4.1 손실 함수
8.4.2 옵티마이저
8.4.3 모델 훈련시키기
8.4.4 테스트셋으로 평가하기
8.5 선형 활성화 함수로 구성된 2-계층 과소완전 오토인코더
8.5.1 노드 수 늘리기
8.5.2 은닉층 추가하기
8.6 비선형 오토인코더
8.7 선형 활성화 함수로 구성된 과대완전 오토인코더
8.8 선형 활성화 함수와 드롭아웃으로 구성된 과대완전 오토인코더
8.9 선형 활성화 함수로 구성된 희소 과대완전 오토인코더
8.10 선형 활성화 함수와 드롭아웃으로 구성된 희소 과대완전 오토인코더
8.11 노이즈 데이터셋 생성
8.12 노이즈 제거 오토인코더
8.12.1 선형 활성화 함수로 구성된 2-계층 노이즈 제거 과소완전 오토인코더
8.12.2 선형 활성화 함수로 구성된 2-계층 노이즈 제거 과대완전 오토인코더
8.12.3 ReLu 활성화 함수로 구성된 2-계층 노이즈 제거 과대완전 오토인코더
8.13 마치며
준지도 학습
9.1 데이터 준비
9.2 지도 학습 모델
9.3 비지도 학습 모델
9.4 준지도 학습 모델
9.5 지도 학습과 비지도 학습의 강력함
9.6 마치며
텐서플로와 케라스를 사용한 심층 비지도 학습
RBM을 사용한 추천 시스템
10.1 볼츠만 머신
10.1.1 RBM
10.2 추천 시스템
10.2.1 협업 필터링
10.2.2 넷플릭스 경진 대회
10.3 무비렌즈 데이터셋
10.3.1 데이터 준비
10.3.2 비용 함수 정의: 평균 제곱 오차
10.3.3 기본 모델 성능 실험
10.4 행렬 인수분해
10.4.1 잠재 요인이 1개일 때
10.4.2 잠재 요인이 3개일 때
10.4.3 잠재 요인이 5개일 때
10.5 RBM을 사용한 협업 필터링
10.5.1 RBM 신경망 아키텍처
10.5.2 RBM 클래스의 구성 요소 구축하기
10.5.3 추천 시스템을 위한 RBM 훈련시키기
10.6 마치며
DBN을 사용한 피처 추출
11.1 심층 신뢰 신경망 자세히 살펴보기
11.2 MNIST 이미지 분류하기
11.3 RBM
11.3.1 RBM 클래스의 구성 요소 구축하기
11.3.2 RBM 모델을 사용해 이미지 생성하기
11.3.3 은닉층 피처 추출기 정의하기
11.4 DBN을 위한 세 RBM 훈련
11.4.1 피처 추출기 확인하기
11.4.2 생성한 이미지 보기
11.5 전체 DBN
11.5.1 DBN 훈련 방법
11.5.2 DBN 훈련
11.6 비지도 학습이 지도 학습을 개선하는 방법
11.6.1 개선된 이미지 분류기 구축을 위한 이미지 생성 (1/2)
11.6.1 개선된 이미지 분류기 구축을 위한 이미지 생성 (2/2)
11.7 LightGBM을 사용한 이미지 분류기
11.7.1 지도 학습
11.7.2 비지도 학습과 지도 학습 솔루션
11.8 마치며
GAN
12.1 GAN의 개념
12.1.1 GAN의 강력함
12.2 DCGAN
12.3 CNN
12.4 DCGAN으로 돌아가기
12.4.1 DCGAN의 생성자
12.4.2 DCGAN의 감별자
12.4.3 감별자와 적대 모델
12.4.4 MNIST 데이터셋에 DCGAN 적용하기
12.5 MNIST DCGAN 실행
12.5.1 합성 이미지 생성
12.6 마치며
시계열 클러스터링
13.1 심전도 데이터
13.2 시계열 클러스터링 접근 방법
13.2.1 k-Shape
13.3 ECGFiveDays 데이터셋에서 k-Shape을 사용한 시계열 클러스터링
13.3.1 데이터 준비
13.3.2 훈련 및 평가
13.4 ECG5000 데이터셋에서 k-Shape을 사용한 시계열 클러스터링
13.4.1 데이터 준비
13.4.2 훈련 및 평가
13.5 ECG5000 데이터셋에서 k-평균을 사용한 시계열 클러스터링
13.6 ECG5000 데이터셋에서 HDBSCAN을 사용한 시계열 클러스터링
13.7 시계열 클러스터링 알고리즘 비교
13.7.1 k-Shape 사용한 전체 수행
13.7.2 k-평균을 사용한 전체 수행
13.7.3 HDBSCAN을 사용한 전체 수행
13.7.4 모든 시계열 클러스터링 접근 방법 비교
13.8 마치며
결론
14.1 지도 학습
14.2 비지도 학습
14.2.1 사이킷런
14.2.2 텐서플로와 케라스
14.3 강화 학습
14.4 오늘날 가장 유망한 비지도 학습 분야
14.5 비지도 학습의 미래
14.6 마치며
찾아보기 (1/2)
찾아보기 (2/2)

Content preview from 핸즈온 비지도 학습

306

3부 텐서플로와 케라스를 사용한 비지도 학습 모델

9.3

비지도 학습 모델

이제 비지도 학습을 사용해 사기 탐지 솔루션을 구축하겠습니다. 구체적으로

개 노드의 은

닉층과 드롭아웃

%, 선형 활성화 함수를 사용하는 희소

-계층 과대완전 오토인코더를 구축

할 겁니다.

이번에는 사기 거래 수를

오버샘플링

oversampling

해 훈련셋을 조정하겠습니다. 오버샘플링은 주어

진 데이터셋의 클래스 분포를 조정하는 데 사용하는 기술입니다. 우리가 훈련시키는 오토인코

더가 정상/비사기 거래와 비정상/사기 거래를 더욱 쉽게 구분할 수 있도록 데이터셋에 사기성

거래를 더 많이 추가하는 겁니다.

이전 작업에서 우리는 훈련셋에 존재하는 사기 거래

%를 삭제했습니다. 그 결과 훈련셋에

남은 사기 거래 건수는 단

건입니다. 우리는 이 사기 거래

건을

100

배 복제한 다음 훈련

셋에 추가할 겁니다. 또한 오버샘플링되지 않은 훈련셋의 복사본을 보관해 나머지 머신러닝 파

이프 라인에서 사용할 겁니다.

테스트셋은 별도로 건드리지 않을 겁니다. 오버샘플링은 훈련셋에만 적용합니다.

oversampl ultiplier = 100

X_train_original = X_train.copy()

y_train_original = y_train.copy()

X_test_original = X_test ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9791162243190

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

핸즈온 비지도 학습

by 강재원, 권재철, 안쿠르 A. 파텔

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

파이썬으로 살펴보는 아키텍처 패턴

개발자를 위한 머신러닝&딥러닝

개발자를 위한 실전 선형대수학

코드로 인프라 관리하기(2판)

Publisher Resources