book

PyTorch의 코더를 위한 AI 및 ML

Name: PyTorch의 코더를 위한 AI 및 ML
Author: Laurence Moroney
ISBN: 9798341662605

by Laurence Moroney

July 2025

Beginner to intermediate

444 pages

7h 30m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

머리말
서문
이 책을 읽어야 하는 대상이 책을 쓴 이유이 책 탐색하기이해해야 할 기술온라인 리소스이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사의 말
1. PyTorch 소개
머신러닝이란 무엇인가요?기존 프로그래밍의 한계프로그래밍에서 학습으로PyTorch란 무엇인가요?PyTorch 사용하기Python에서 Porch 설치하기PyCharm에서 PyTorch 사용하기Google Colab에서 PyTorch 사용하기머신 러닝 시작하기네트워크에서 학습한 내용 보기요약
2. 컴퓨터 비전 소개
컴퓨터 비전의 작동 원리패션 MNIST 데이터베이스시각을 위한 뉴런신경망 설계하기전체 코드신경망 훈련하기모델 출력 살펴보기과적합조기 중지요약
3. 기본을 넘어서 Go: 이미지에서 특징 감지하기
컨볼루션풀링컨볼루션 신경망 구현하기컨볼루션 네트워크 살펴보기말과 사람을 구별하는 CNN 구축하기"말 또는 인간" 데이터 세트데이터 처리하기"말 또는 인간"을 위한 CNN 아키텍처"말 또는 인간" 데이터 세트에 유효성 검사 추가하기"말 또는 사람" 이미지 테스트하기이미지 증강전이 학습멀티클래스 분류드롭아웃 정규화요약
4. PyTorch로 데이터 사용하기
데이터 세트 시작하기FashionMNIST 클래스 살펴보기일반 데이터 집합 클래스ImageFolderDatasetFolderFakeData사용자 지정 분할 사용머신 러닝에서 데이터를 관리하기 위한 ETL 프로세스로드 단계 최적화하기데이터로더 클래스 사용하기일괄 처리셔플링병렬 데이터 로드사용자 정의 데이터 샘플링훈련 성능 향상을 위한 ETL 병렬화요약
5. 자연어 처리 소개
언어를 숫자로 인코딩하기토큰화 시작하기문장을 시퀀스로 전환하기중지어 제거 및 텍스트 정리하기HTML 태그 제거하기중지어 제거하기구두점 제거하기실제 데이터 소스로 작업하기텍스트 데이터 세트 가져오기CSV 파일에서 텍스트 가져오기JSON 파일에서 텍스트 가져오기요약
6. 임베딩을 사용하여 프로그래밍 가능한 감정 만들기
단어에서 의미 설정하기간단한 예제 양수 및 음수조금 더 깊이 들어가기: 벡터PyTorch에 임베딩하기임베딩을 사용하여 풍자 감지기 구축하기언어 모델에서 과적합 줄이기모든 것 종합하기모델을 사용하여 문장 분류하기임베딩 시각화하기사전 학습된 임베딩 사용요약
7. 자연어 처리를 위한 순환 신경망 7.
재귀의 기초언어에 대한 재귀 확장RNN으로 텍스트 분류기 생성하기LSTM 스태킹하기RNN으로 사전 훈련된 임베딩 사용하기요약
8. ML을 사용하여 텍스트 생성하기
시퀀스를 입력 시퀀스로 전환하기모델 만들기텍스트 생성하기다음 단어 예측하기예측을 조합하여 텍스트 생성하기데이터 세트 확장하기모델 아키텍처 개선하기차원 임베딩하기LSTM 초기화하기가변 학습률데이터 개선하기문자 기반 인코딩요약

9. 시퀀스 및 시계열 데이터 이해하기
시계열의 공통 속성트렌드계절성자동 상관 관계노이즈시계열 예측을 위한 기법기준선 생성을 위한 나이브 예측예측 정확도 측정덜 순진한 예측: 예측에 이동 평균 사용이동 평균 분석 개선하기요약
10. 시퀀스 예측을 위한 ML 모델 만들기
Windows 데이터 집합 만들기시계열 데이터 집합의 Windows 버전 만들기시퀀스 데이터에 맞게 DNN 생성 및 훈련하기DNN 결과 평가하기학습 속도 조정하기요약
11. 시퀀스 모델에 컨볼루션 및 반복 방법 사용하기
시퀀스 데이터의 컨볼루션컨볼루션 코딩하기Conv1D 하이퍼파라미터로 실험하기NASA 기상 데이터 사용Python에서 GISS 데이터 읽기시퀀스 모델링에 RNN 사용하기더 큰 데이터 집합 탐색다른 반복 방법 사용드롭아웃 사용양방향 RNN 사용하기요약
12. 추론의 개념
텐서이미지 데이터텍스트 데이터모델 밖의 텐서요약
13. 서빙을 위한 PyTorch 모델 호스팅하기
토치서브 소개TorchServe 설정하기환경 준비하기config.properties 파일 설정하기모델 정의하기핸들러 파일 만들기모델 아카이브 만들기서버 시작하기추론 테스트하기Go FurtherFlask로 서빙하기Flask를 위한 환경 만들기Python에서 Flask 서버 생성하기요약
14. 서드파티 모델과 허브 사용하기
허깅 페이스 허브허깅 페이스 허브 사용하기허깅 페이스 허브의 모델 사용하기PyTorch 허브PyTorch 비전 모델 사용하기자연어 처리기타 모델요약
15. 변압기 및 변압기
트랜스포머 이해하기인코더 아키텍처디코더 아키텍처인코더-디코더 아키텍처트랜스포머 API트랜스포머 시작하기핵심 개념파이프라인토큰화요약
16. 사용자 지정 데이터와 함께 LLM 사용
LLM 미세 조정하기설정 및 종속성데이터 로드 및 검사모델과 토큰화기 초기화하기데이터 전처리데이터 정렬메트릭 정의하기트레이닝 구성하기트레이너 초기화하기트레이닝 및 평가모델 저장 및 테스트LLM 프롬프트 튜닝하기(prompt-tuning)데이터 준비하기데이터 로더 생성하기모델 정의하기모델 훈련훈련 중 평가트레이닝 지표 보고하기프롬프트 임베딩 저장하기모델로 추론 수행하기요약
17. Ollama로 LLM 서비스하기
올라마 시작하기서버로 올라마 실행하기올라마 LLM을 사용하는 앱 빌드하기시나리오Python 개념 증명 구축하기Ollama용 웹 앱 만들기app.js 파일Index.html 파일요약
18. RAG 소개
RAG란 무엇인가요?RAG 시작하기유사성 이해하기데이터베이스 생성하기유사성 검색 수행하기모든 것 종합하기LLM으로 RAG 콘텐츠 사용하기호스팅 모델로 확장하기요약
19. 허깅 페이스 디퓨저로 제너레이티브 모델 사용하기
확산 모델이란 무엇인가요?허깅 페이스 디퓨저 사용하기디퓨저를 사용한 이미지 간 이미지디퓨저로 인페인팅하기요약
20. LoRA와 디퓨저로 제너레이티브 이미지 모델 튜닝하기
디퓨저로 LoRA 훈련하기디퓨저 가져오기LoRA 미세 조정을 위한 데이터 가져오기디퓨저로 모델 미세 조정하기모델 게시하기커스텀 LoRA로 이미지 생성하기요약
색인
저자 소개

Content preview from PyTorch의 코더를 위한 AI 및 ML

7장. 자연어 처리를 위한 순환 신경망

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

5장에서는 텍스트를 토큰화하고 시퀀싱하여 문장을 텐서라는 숫자로 변환한 다음 신경망에 공급하는 방법을 살펴봤습니다. 그런 다음 6장에서는 이를 확장하여 비슷한 의미를 가진 단어들을 한데 묶어 감정을 계산할 수 있도록 하는 임베딩에 대해 살펴보았습니다. 풍자 분류기를 구축하면서 보셨듯이 이 방법은 정말 잘 작동했습니다. 하지만 여기에는 한계가 있습니다. 즉, 문장은 단순한 단어의 집합이 아니며 단어가 나타나는 순서에 따라 전체적인 의미가 결정되는 경우가 많다는 점입니다. 또한 형용사는 옆에 나오는 명사의 의미를 추가하거나 변경할 수 있습니다. 예를 들어, 파란색이라는 단어는 하늘과 마찬가지로 정서적 관점에서는 무의미할 수 있지만, 두 단어를 합쳐서 푸른 하늘을 만들면 일반적으로 긍정적인 정서를 나타냅니다. 마지막으로, 비 구름, 책상, 커피잔과 같이 일부 명사는 다른 명사를 한정할 수 있습니다.

이와 같은 시퀀스를 고려하려면 모델 아키텍처에 재귀를 고려하는 추가적인 접근 방식을 취해야 합니다. 이 장에서는 이를 위한 다양한 방법을 살펴보겠습니다. 시퀀스 정보를 학습하는 방법과 이 정보를 사용하여 텍스트를 더 잘 이해할 수 있는 모델 유형인 순환 신경망 (RNN)을 만드는 방법을 살펴보겠습니다.

재귀의 기초

의 작동 원리를 이해하기 위해 먼저 이 책에서 지금까지 사용된 모델의 한계를 고려해 보겠습니다. 궁극적으로 모델을 만드는 과정은 그림 7-1과 비슷합니다. 데이터와 레이블을 제공하고 모델 아키텍처를 정의하면 모델이 데이터와 레이블에 맞는 규칙을 학습합니다. 그런 다음 이러한 규칙은 향후 데이터에 대한 예측 레이블을 다시 제공하는 API(애플리케이션 프로그래밍 인터페이스)로 제공됩니다.

하지만 보시다시피 데이터는 일괄적으로 묶여 있습니다. 세분화되어 있지 않고 데이터가 발생하는 순서를 이해하려는 노력도 없습니다. 즉, "하늘이 회색이기 때문에 오늘 나는 파랗다.", "오늘 나는 행복하고 아름다운 푸른 하늘이 있다."와 같은 문장에서 파란색과 하늘이라는 단어는 서로 다른 의미를 갖지 않습니다. 우리에게는 이러한 단어 사용의 차이가 분명하지만, 여기에 표시된 아키텍처를 사용하는 모델에게는 실제로 아무런 차이가 없습니다.

그렇다면 이 문제를 어떻게 해결할 수 있을까요? 먼저 재귀의 본질을 살펴보고, 이를 통해 기본적인 RNN이 어떻게 작동하는지 살펴볼 수 있습니다.

유명한 피보나치 수열을 생각해 보세요. 익숙하지 않은 분들을 위해 그림 7-2에 그 중 일부를 넣었습니다.

그림 7-2. 피보나치 수열의 처음 몇 개의 숫자

이 수열의 기본 개념은 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341662605

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business