핸즈온 비지도 학습

Book description

이 책은 케라스를 사용한 텐서플로와 안정화된 파이썬 프레임워크인 사이킷런으로 비지도 학습 적용 방법을 알려준다. 다양한 실습 예제와 코드를 통해 데이터에 내재된 패턴을 찾아내어 깊이 있는 비즈니스 통찰력을 얻거나 이상 징후를 감지할 수 있다. 또한 자동화된 피처 엔지니어링 및 피처 선택을 수행하고 새로운 합성 데이터셋을 생성할 수 있다. 약간의 머신러닝 경험과 프로그래밍 스킬만 있으면 이 책으로 비지도 학습 기법을 쉽게 익힐 수 있을 것이다.

Table of contents

  1. CONTENTS
  2. 지은이·옮긴이 소개 (1/4)
  3. 지은이·옮긴이 소개 (2/4)
  4. 지은이·옮긴이 소개 (3/4)
  5. 지은이·옮긴이 소개 (4/4)
    1. 옮긴이의 글 (1/4)
    2. 옮긴이의 글 (2/4)
    3. 옮긴이의 글 (3/4)
    4. 옮긴이의 글 (4/4)
    5. 추천의 글 (1/4)
    6. 추천의 글 (2/4)
    7. 추천의 글 (3/4)
    8. 추천의 글 (4/4)
    9. 베타리더의 한마디 (1/4)
    10. 베타리더의 한마디 (2/4)
    11. 베타리더의 한마디 (3/4)
    12. 베타리더의 한마디 (4/4)
  6. 서문
    1. 0.1 머신러닝의 역사
    2. 0.2 인공지능의 귀환, 왜 지금인가?
    3. 0.3 응용 인공지능의 출현
    4. 0.4 지난 20년간 응용 인공지능 주요 성과
    5. 0.5 좁은 인공지능부터 범용 인공지능까지
    6. 0.6 목표와 접근방식
    7. 0.7 이 책의 구성
    8. 0.8 예제 다운로드 안내
  7. 비지도 학습 개요
  8. 머신러닝 생태계와 비지도 학습
    1. 1.1 머신러닝 기본 용어 이해하기
    2. 1.2 규칙 기반과 머신러닝 비교하기
    3. 1.3 지도 학습과 비지도 학습 비교하기
      1. 1.3.1 지도 학습의 강점과 약점
      2. 1.3.2 비지도 학습의 강점과 약점
    4. 1.4 비지도 학습을 사용해 머신러닝 솔루션 개선하기
    5. 1.5 지도 학습 알고리즘 자세히 살펴보기
      1. 1.5.1 선형 방법
      2. 1.5.2 이웃 기반 방법
      3. 1.5.3 트리 기반 방법
      4. 1.5.4 SVM
      5. 1.5.5 신경망
    6. 1.6 비지도 학습 알고리즘 자세히 살펴보기
      1. 1.6.1 차원 축소
      2. 1.6.2 클러스터링
      3. 1.6.3 피처 추출
      4. 1.6.4 비지도 딥러닝
      5. 1.6.5 비지도 학습을 사용해 순차 데이터 문제 해결
    7. 1.7 비지도 학습을 활용한 강화 학습
    8. 1.8 준지도 학습
    9. 1.9 비지도 학습의 성공적인 응용 사례
      1. 1.9.1 이상치 탐지
      2. 1.9.2 그룹 세분화
    10. 1.10 마치며
  9. 머신러닝 프로젝트 A to Z
    1. 2.1 환경 설정
      1. 2.1.1 버전 관리: 깃
      2. 2.1.2 핸즈온 비지도 학습의 깃 리포지터리 복제
      3. 2.1.3 데이터 과학 라이브러리: 파이썬 아나콘다 배포판
      4. 2.1.4 신경망: 텐서플로와 케라스
      5. 2.1.5 그레이디언트 부스팅, 버전 1: XGBoost
      6. 2.1.6 그레이디언트 부스팅, 버전 2: LightGBM
      7. 2.1.7 클러스터링 알고리즘
      8. 2.1.8 대화형 컴퓨팅 환경: 주피터 노트북
    2. 2.2 데이터 개요
    3. 2.3 데이터 준비하기
      1. 2.3.1 데이터 획득하기
      2. 2.3.2 데이터 탐색하기
      3. 2.3.3 피처 행렬 및 레이블 배열 생성하기
      4. 2.3.4 피처 엔지니어링 및 피처 선택하기
      5. 2.3.5 데이터 시각화하기
    4. 2.4 모델 준비하기
      1. 2.4.1 훈련 및 테스트 데이터셋으로 분할하기
      2. 2.4.2 비용 함수 선택하기
      3. 2.4.3 k-겹 교차검증 데이터셋 생성하기
    5. 2.5 머신러닝 모델(1)
      1. 2.5.1 모델 #1: 로지스틱 회귀 분석
    6. 2.6 평가 지표
      1. 2.6.1 오차 행렬
      2. 2.6.2 정밀도-재현율 곡선
      3. 2.6.3 수신자 조작 특성
    7. 2.7. 머신러닝 모델(2)
      1. 2.7.1 모델 #2: 랜덤 포레스트
      2. 2.7.2 모델 #3: 그레이디언트 부스팅 머신(XGBoost)
      3. 2.7.3 모델 #4: 그레이디언트 부스팅 머신(LightGBM)
    8. 2.8 테스트 데이터셋으로 4가지 모델 평가하기 (1/2)
    9. 2.8 테스트 데이터셋으로 4가지 모델 평가하기 (2/2)
    10. 2.9 앙상블
      1. 2.9.1 스태킹
    11. 2.10 최종 모델 선택하기
    12. 2.11 프로덕션 파이프라인
    13. 2.12 마치며
  10. 사이킷런을 사용한 비지도 학습 모델
  11. 차원 축소
    1. 3.1 차원 축소에 대한 동기 부여
      1. 3.1.1 MNIST 숫자 데이터베이스
    2. 3.2 차원 축소 알고리즘
      1. 3.2.1 선형 투영 vs 매니폴드 학습
    3. 3.3 PCA
      1. 3.3.1 PCA 개요
      2. 3.3.2 PCA 실전 예제
      3. 3.3.3 점진적 PCA
      4. 3.3.4 희소 PCA
      5. 3.3.5 커널 PCA
    4. 3.4 SVD
    5. 3.5 랜덤 투영
      1. 3.5.1 GRP
      2. 3.5.2 SRP
    6. 3.6 Isomap
    7. 3.7 MDS
    8. 3.8 LLE
    9. 3.9 t-SNE
    10. 3.10 사전 학습
    11. 3.11 ICA
    12. 3.12 마치며
  12. 이상치 탐지
    1. 4.1 신용카드 사기 탐지
      1. 4.1.1 데이터 준비하기
      2. 4.1.2 이상치 스코어 함수 정의하기
      3. 4.1.3 평가 지표 정의하기
      4. 4.1.4 시각화 함수 정의하기
    2. 4.2 일반 PCA를 활용한 이상치 탐지
      1. 4.2.1 원본 차원의 수와 동일한 PCA 주성분 수
      2. 4.2.2 최적의 주성분 개수 찾기
    3. 4.3 희소 PCA를 활용한 이상치 탐지
    4. 4.4 커널 PCA를 활용한 이상치 탐지
    5. 4.5 GRP를 활용한 이상치 탐지
    6. 4.6 SRP를 활용한 이상치 탐지
    7. 4.7 비선형 이상치 탐지
    8. 4.8 사전 학습을 활용한 이상치 탐지
    9. 4.9 ICA를 활용한 이상치 탐지
    10. 4.10 테스트셋으로 이상치 탐지 성능 평가
      1. 4.10.1 테스트셋으로 일반 PCA의 이상치 탐지 성능 평가하기
      2. 4.10.2 테스트셋으로 ICA의 이상치 탐지 성능 평가하기
      3. 4.10.3 테스트셋으로 사전 학습의 이상치 탐지 성능 평가하기
    11. 4.11 마치며
  13. 클러스터링
    1. 5.1 MNIST 데이터셋
      1. 5.1.1 데이터 준비하기
    2. 5.2 클러스터링 알고리즘
    3. 5.3 k-평균
      1. 5.3.1 k-평균 관성
      2. 5.3.2 클러스터링 결과 평가하기
      3. 5.3.3 k-평균 정확도
      4. 5.3.4 k-평균과 주성분 개수
      5. 5.3.5 원본 데이터셋에서 k-평균 실행하기
    4. 5.4 계층적 클러스터링
      1. 5.4.1 병합 계층적 클러스터링
      2. 5.4.2 덴드로그램
      3. 5.4.3 클러스터링 결과 평가하기
    5. 5.5 DBSCAN 개요
      1. 5.5.1 DBSCAN
      2. 5.5.2 MNIST 데이터셋에 DBSCAN 적용하기
      3. 5.3.3 HDBSCAN
    6. 5.6 마치며
  14. 그룹 세분화
    1. 6.1 랜딩 클럽 데이터
      1. 6.1.1 데이터 준비하기
      2. 6.1.2 문자형을 숫자형으로 변환하기
      3. 6.1.3 결측값 대체하기
      4. 6.1.4 피처 엔지니어
      5. 6.1.5 최종 피처셋을 선택하고 스케일링하기
      6. 6.1.6 평가를 위한 레이블 정의하기
    2. 6.2 군집 적합도 검정
    3. 6.3 k-평균 클러스터링 응용 프로그램
    4. 6.4 계층적 클러스터링 응용 프로그램
    5. 6.5 HDBSCAN 응용 프로그램
    6. 6.6 마치며
  15. 텐서플로와 케라스를 사용한 비지도 학습 모델
  16. 오토인코더
    1. 7.1 신경망
      1. 7.1.1 텐서플로
      2. 7.1.2 케라스
    2. 7.2 오토인코더: 인코더와 디코더
    3. 7.3 과소완전 오토인코더
    4. 7.4 과대완전 오토인코더
    5. 7.5 고밀도 vs 희소 오토인코더
    6. 7.6 노이즈 제거 오토인코더
    7. 7.7 변분 오토인코더
    8. 7.8 마치며
  17. 핸즈온 오토인코더
    1. 8.1 데이터 준비
    2. 8.2 오토인코더의 구성 요소
    3. 8.3 활성화 함수
    4. 8.4 첫 번째 오토인코더
      1. 8.4.1 손실 함수
      2. 8.4.2 옵티마이저
      3. 8.4.3 모델 훈련시키기
      4. 8.4.4 테스트셋으로 평가하기
    5. 8.5 선형 활성화 함수로 구성된 2-계층 과소완전 오토인코더
      1. 8.5.1 노드 수 늘리기
      2. 8.5.2 은닉층 추가하기
    6. 8.6 비선형 오토인코더
    7. 8.7 선형 활성화 함수로 구성된 과대완전 오토인코더
    8. 8.8 선형 활성화 함수와 드롭아웃으로 구성된 과대완전 오토인코더
    9. 8.9 선형 활성화 함수로 구성된 희소 과대완전 오토인코더
    10. 8.10 선형 활성화 함수와 드롭아웃으로 구성된 희소 과대완전 오토인코더
    11. 8.11 노이즈 데이터셋 생성
    12. 8.12 노이즈 제거 오토인코더
      1. 8.12.1 선형 활성화 함수로 구성된 2-계층 노이즈 제거 과소완전 오토인코더
      2. 8.12.2 선형 활성화 함수로 구성된 2-계층 노이즈 제거 과대완전 오토인코더
      3. 8.12.3 ReLu 활성화 함수로 구성된 2-계층 노이즈 제거 과대완전 오토인코더
    13. 8.13 마치며
  18. 준지도 학습
    1. 9.1 데이터 준비
    2. 9.2 지도 학습 모델
    3. 9.3 비지도 학습 모델
    4. 9.4 준지도 학습 모델
    5. 9.5 지도 학습과 비지도 학습의 강력함
    6. 9.6 마치며
  19. 텐서플로와 케라스를 사용한 심층 비지도 학습
  20. RBM을 사용한 추천 시스템
    1. 10.1 볼츠만 머신
      1. 10.1.1 RBM
    2. 10.2 추천 시스템
      1. 10.2.1 협업 필터링
      2. 10.2.2 넷플릭스 경진 대회
    3. 10.3 무비렌즈 데이터셋
      1. 10.3.1 데이터 준비
      2. 10.3.2 비용 함수 정의: 평균 제곱 오차
      3. 10.3.3 기본 모델 성능 실험
    4. 10.4 행렬 인수분해
      1. 10.4.1 잠재 요인이 1개일 때
      2. 10.4.2 잠재 요인이 3개일 때
      3. 10.4.3 잠재 요인이 5개일 때
    5. 10.5 RBM을 사용한 협업 필터링
      1. 10.5.1 RBM 신경망 아키텍처
      2. 10.5.2 RBM 클래스의 구성 요소 구축하기
      3. 10.5.3 추천 시스템을 위한 RBM 훈련시키기
    6. 10.6 마치며
  21. DBN을 사용한 피처 추출
    1. 11.1 심층 신뢰 신경망 자세히 살펴보기
    2. 11.2 MNIST 이미지 분류하기
    3. 11.3 RBM
      1. 11.3.1 RBM 클래스의 구성 요소 구축하기
      2. 11.3.2 RBM 모델을 사용해 이미지 생성하기
      3. 11.3.3 은닉층 피처 추출기 정의하기
    4. 11.4 DBN을 위한 세 RBM 훈련
      1. 11.4.1 피처 추출기 확인하기
      2. 11.4.2 생성한 이미지 보기
    5. 11.5 전체 DBN
      1. 11.5.1 DBN 훈련 방법
      2. 11.5.2 DBN 훈련
    6. 11.6 비지도 학습이 지도 학습을 개선하는 방법
      1. 11.6.1 개선된 이미지 분류기 구축을 위한 이미지 생성 (1/2)
      2. 11.6.1 개선된 이미지 분류기 구축을 위한 이미지 생성 (2/2)
    7. 11.7 LightGBM을 사용한 이미지 분류기
      1. 11.7.1 지도 학습
      2. 11.7.2 비지도 학습과 지도 학습 솔루션
    8. 11.8 마치며
  22. GAN
    1. 12.1 GAN의 개념
      1. 12.1.1 GAN의 강력함
    2. 12.2 DCGAN
    3. 12.3 CNN
    4. 12.4 DCGAN으로 돌아가기
      1. 12.4.1 DCGAN의 생성자
      2. 12.4.2 DCGAN의 감별자
      3. 12.4.3 감별자와 적대 모델
      4. 12.4.4 MNIST 데이터셋에 DCGAN 적용하기
    5. 12.5 MNIST DCGAN 실행
      1. 12.5.1 합성 이미지 생성
    6. 12.6 마치며
  23. 시계열 클러스터링
    1. 13.1 심전도 데이터
    2. 13.2 시계열 클러스터링 접근 방법
      1. 13.2.1 k-Shape
    3. 13.3 ECGFiveDays 데이터셋에서 k-Shape을 사용한 시계열 클러스터링
      1. 13.3.1 데이터 준비
      2. 13.3.2 훈련 및 평가
    4. 13.4 ECG5000 데이터셋에서 k-Shape을 사용한 시계열 클러스터링
      1. 13.4.1 데이터 준비
      2. 13.4.2 훈련 및 평가
    5. 13.5 ECG5000 데이터셋에서 k-평균을 사용한 시계열 클러스터링
    6. 13.6 ECG5000 데이터셋에서 HDBSCAN을 사용한 시계열 클러스터링
    7. 13.7 시계열 클러스터링 알고리즘 비교
      1. 13.7.1 k-Shape 사용한 전체 수행
      2. 13.7.2 k-평균을 사용한 전체 수행
      3. 13.7.3 HDBSCAN을 사용한 전체 수행
      4. 13.7.4 모든 시계열 클러스터링 접근 방법 비교
    8. 13.8 마치며
  24. 결론
    1. 14.1 지도 학습
    2. 14.2 비지도 학습
      1. 14.2.1 사이킷런
      2. 14.2.2 텐서플로와 케라스
    3. 14.3 강화 학습
    4. 14.4 오늘날 가장 유망한 비지도 학습 분야
    5. 14.5 비지도 학습의 미래
    6. 14.6 마치며
      1. 찾아보기 (1/2)
      2. 찾아보기 (2/2)

Product information

  • Title: 핸즈온 비지도 학습
  • Author(s): 강재원, 권재철, 안쿠르 A. 파텔
  • Release date: July 2020
  • Publisher(s): Hanbit Media, Inc.
  • ISBN: 9791162247693