book

딥러닝의 정석(2판)

Name: 딥러닝의 정석(2판)
ISBN: 9791169211925

by 니틴 부두마, 니킬 부두마, 조 파파, 성태응[감수], 맹윤호[감수], 최재훈, 차성재

February 2024

Beginner to intermediate

428 pages

9h 40m

Korean

Hanbit Media, Inc.

Read now

Unlock full access

베타리더의 후기
지은이 소개
옮긴이 소개
옮긴이의 말
감수자의 말
서문
목차 (1/2)
목차 (2/2)
CHAPTER 1 딥러닝을 위한 선형대수학 기초
1.1 데이터 구조와 연산
1.1.1 행렬 연산

1.1.2 벡터 연산
1.1.3 행렬-벡터 곱셈
1.2 기본 공간
1.2.1 열공간
1.2.2 영공간
1.3 고유벡터와 고윳값
요약
CHAPTER 2 확률 기초
2.1 사건과 확률
2.2 조건부 확률
2.3 확률 변수
2.4 기댓값
2.5 분산
2.6 베이즈 정리
2.7 엔트로피, 교차 엔트로피 및 KL 발산
2.8 연속 확률 분포
요약
CHAPTER 3 신경망
3.1 지능형 머신 구축
3.2 전통적인 컴퓨터 프로그램의 한계
3.3 머신러닝 동작 원리
3.4 뉴런
3.5 뉴런으로 나타낸 선형 퍼셉트론
3.6 순방향 신경망
3.7 선형 뉴런과 그 한계
3.8 시그모이드 뉴런, Tanh 뉴런, ReLU 뉴런
3.9 소프트맥스 출력 레이어
요약
CHAPTER 4 순방향 신경망 훈련
4.1 패스트푸드 문제
4.2 경사하강법
4.3 델타 규칙과 학습률
4.4 시그모이드 뉴런을 이용한 경사하강법
4.5 역전파 알고리즘
4.6 확률적 경사하강법과 미니배치 경사하강법
4.7 테스트셋, 검증셋, 과적합 (1/2)
4.7 테스트셋, 검증셋, 과적합 (2/2)
4.8 심층 신경망 과적합 방지 (1/2)
4.8 심층 신경망 과적합 방지 (2/2)
요약
CHAPTER 5 PyTorch 기반 신경망 구현
5.1 PyTorch 소개5.2 PyTorch 설치
5.3 PyTorch 텐서
5.3.1 텐서 초기화
5.3.2 텐서 속성
5.3.3 텐서 연산
5.4 PyTorch에서의 경사
5.5 PyTorch nn 모듈
5.6 PyTorch 데이터셋과 데이터 로더
5.7 PyTorch에서 MNIST 분류기 구축
요약
CHAPTER 6 경사하강법
6.1 경사하강법의 도전 과제
6.2 심층 신경망 오차 표면의 극소점
6.3 모델 식별성
6.4 심층 신경망에서 가짜 극소점이 미치는 영향
6.5 오차 표면의 평평한 영역
6.6 경사 방향이 잘못된 경우
6.7 모멘텀 기반 최적화
6.8 간략한 이차 근사 방법 개요
6.9 학습률 적응
6.9.1 AdaGrad: 경사 누적 알고리즘
6.9.2 RMSProp: 경사 지수 가중 이동 평균
6.9.3 Adam: 모멘텀과 RMSProp의 결합
6.10 옵티마이저 선택의 철학
요약
CHAPTER 7 합성곱 신경망
7.1 인간 시각에서의 뉴런
7.2 피처 선택의 한계
7.3 기본 심층 신경망의 확장 한계
7.4 필터와 피처 맵
7.5 합성곱 레이어에 대한 상세 설명
7.6 맥스 풀링
7.7 합성곱 신경망 아키텍처 상세 설명
7.8 합성곱 신경망으로 MNIST 문제 해결
7.9 이미지 전처리 파이프라인으로 더욱 강건한 모델 지원
7.10 배치 정규화를 통한 훈련 가속화
7.11 메모리 제약이 있는 학습 작업을 위한 그룹 정규화
7.12 CIFAR-10을 위한 합성곱 신경망 구축
7.13 합성곱 신경망에서 학습 시각화
7.14 복잡한 심층 신경망을 위한 잔차 학습과 스킵 연결
7.15 인간을 초월한 시각을 지닌 잔차 신경망 구축
7.16 합성곱 필터를 활용한 예술 스타일 재현
7.17 다른 문제 도메인에 적용되는 합성곱 필터 학습
요약
CHAPTER 8 임베딩과 표현 학습
8.1 저차원 표현 학습
8.2 주성분 분석
8.3 오토인코더 아키텍처의 필요성
8.4 PyTorch에서 오토인코더 구현 (1/3)
8.4 PyTorch에서 오토인코더 구현 (2/3)
8.4 PyTorch에서 오토인코더 구현 (3/3)
8.5 노이즈에 강한 표현을 위한 디노이징
8.6 오토인코더에서의 희소성
8.7 입력 벡터보다 컨텍스트에서 더 많은 정보를 제공하는 경우
8.8 Word2Vec 프레임워크
8.9 Skip-Gram 아키텍처 구현 (1/2)
8.9 Skip-Gram 아키텍처 구현 (2/2)
요약
CHAPTER 9 시퀀스 분석 모델
9.1 가변 길이 입력 분석
9.2 신경망 N-Gram으로 seq2seq 처리
9.3 품사 태거 구현 (1/2)
9.3 품사 태거 구현 (2/2)
9.4 의존성 파싱과 SyntaxNet
9.5 빔 서치와 전역 정규화
9.6 스테이트풀 딥러닝 모델 사례
9.7 순환 신경망
9.8 경사 소실의 문제점
9.9 장단기 메모리 유닛 (1/2)
9.9 장단기 메모리 유닛 (2/2)
9.10 RNN 모델을 위한 PyTorch 기본 요소
9.11 감정 분석 모델 구현 (1/2)
9.11 감정 분석 모델 구현 (2/2)
9.12 순환 신경망으로 seq2seq 작업 해결
9.13 어텐션으로 순환 신경망 증강
9.14 번역 신경망 분석 (1/3)
9.14 번역 신경망 분석 (2/3)
9.14 번역 신경망 분석 (3/3)
9.15 셀프 어텐션과 트랜스포머
요약
CHAPTER 10 생성 모델
10.1 생성적 적대 신경망 (1/2)
10.1 생성적 적대 신경망 (2/2)
10.2 변이형 오토인코더 (1/3)
10.2 변이형 오토인코더 (2/3)
10.2 변이형 오토인코더 (3/3)
10.3 변이형 오토인코더 구현
10.4 점수 기반 생성 모델
10.5 디노이징 오토인코더와 점수 매칭
요약
CHAPTER 11 해석 가능성 방법론
11.1 개요
11.2 결정 트리와 트리 기반 알고리즘
11.3 선형 회귀
11.4 피처 중요도 평가 방법
11.4.1 순열 피처 중요도
11.4.2 부분 의존도 그래프
11.5 추출적 합리화
11.6 LIME
11.7 SHAP
요약
CHAPTER 12 메모리 증강 신경망
12.1 신경망 튜링 머신
12.2 어텐션 기반 메모리 접근
12.3 NTM 메모리 주소 지정 메커니즘
12.4 미분 가능 신경망 컴퓨터
12.5 DNC에서의 간섭 없는 쓰기
12.6 DNC 메모리 재사용
12.7 DNC 쓰기의 시간적 연결
12.8 DNC 읽기 헤드 이해
12.9 DNC 컨트롤러 신경망
12.10 동작 중인 DNC 시각화
12.11 PyTorch에서 DNC 구현하기
12.12 DNC에 독해를 가르치기
요약
CHAPTER 13 강화 학습
13.1 Atari 게임을 마스터한 심층 강화 학습
13.2 강화 학습 소개
13.3 마르코프 결정 과정
13.3.1 정책
13.3.2 미래 보상
13.3.3 할인된 미래 보상
13.4 탐색과 활용 비교
13.4.1 𝜖-그리디
13.4.2 어닐링된 𝜖-그리디
13.5 정책 학습과 가치 학습 비교
13.6 정책 경사를 이용하는 폴 카트
13.6.1 OpenAI Gym
13.6.2 에이전트 만들기
13.6.3 모델 및 최적화기 구축
13.6.4 샘플링 액션13.6.5 이력 추적
13.6.6 정책 경사 main 함수
13.6.7 폴 카트에서의 PGAgent 성능
13.7 신뢰 영역 정책 최적화
13.8 근접 정책 최적화
13.9 Q러닝과 DQN
13.9.1 벨만 방정식
13.9.2 가치 이터레이션의 문제
13.9.3 Q함수 근사화하기
13.9.4 DQN13.9.5 DQN 훈련하기
13.9.6 학습 안정성
13.9.7 타깃 Q네트워크
13.9.8 경험 리플레이13.9.9 Q함수에서 정책으로
13.9.10 DQN과 마르코프 가정
13.9.11 마르코프 가정에 대한 DQN의 해법13.9.12 DQN으로 Breakout 플레이
13.9.13 아키텍처 구축
13.9.14 프레임 스태킹13.9.15 훈련 연산 설정
13.9.16 타깃 Q네트워크 업데이트
13.9.17 경험 리플레이 구현
13.9.18 DQN 메인 루프
13.9.19 Breakout에 대한 DQNAgent 결과
13.10 DQN의 개선과 그 이상의 발전
13.10.1 심층 순환 Q네트워크
13.10.2 비동기 우위 액터 크리틱 에이전트
13.10.3 비지도 강화 및 보조 학습
요약 (1/2)
요약 (2/2)

Content preview from 딥러닝의 정석(2판)

418

딥러닝의 정석 2판

했다.

A3C

에이전트는

시간 이내에

Atari

Breakout

을 학습할 수 있지만,

DQN

에이전트

는

일가량을 학습해야 한다.

13.10.3

비지도 강화 및 보조 학습

UNREAL

은 딥마인드 출신인 제이드버그

Jaderberg

등이 「

Reinforcement

learning

with

unsupervised

auxiliary

tasks

」

에서 소개한

A3C

를 개선한 것이다.

UNREAL

은 보상 희소성 문제를 해결한다. 강화 학습은 에이전트가 보상을 받기만 하고, 보상

이 증가하거나 감소하는 이유를 정확히 파악하기 어렵기 때문에 학습이 매우 어렵다. 또한 강

화 학습을 하려면 보상을 얻기 위한 좋은 정책뿐만 아니라 월드를 잘 표현하는 것도 학습해야

한다. 희박한 보상과 같이 약한 학습 신호로 이 모든 것을 수행하는 것은 상당히 어려운 일이다.

UNREAL

은 보상 없이 월드에서 무엇을 배울 수 있을까라는 질문을 던진다. 이는 비지도 문제

에서 유용한 월드 표현을 학습하는 것을 목표로 한다. 구체적으로,

UNREAL

은 전체적인 목표

에 몇 가지 추가적인 비지도 보조 작업을 추가한다.

첫 번째 작업은

UNREAL

에이전트가 자기 액션이 환경에 어떤 영향을 미치는지 학습하는 것

이다. 에이전트는 액션을 수행하여 화면의 픽셀값을 제어하는 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9791169211925

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

딥러닝의 정석(2판)

by 니틴 부두마, 니킬 부두마, 조 파파, 성태응[감수], 맹윤호[감수], 최재훈, 차성재

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

핸즈온 머신러닝(3판)

타입스크립트 프로그래밍

러닝 랭체인

구글 엔지니어는 이렇게 일한다

Publisher Resources