book

PyTorch의 코더를 위한 AI 및 ML

Name: PyTorch의 코더를 위한 AI 및 ML
Author: Laurence Moroney
ISBN: 9798341662605

by Laurence Moroney

July 2025

Beginner to intermediate

444 pages

7h 30m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

머리말
서문
이 책을 읽어야 하는 대상이 책을 쓴 이유이 책 탐색하기이해해야 할 기술온라인 리소스이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사의 말
1. PyTorch 소개
머신러닝이란 무엇인가요?기존 프로그래밍의 한계프로그래밍에서 학습으로PyTorch란 무엇인가요?PyTorch 사용하기Python에서 Porch 설치하기PyCharm에서 PyTorch 사용하기Google Colab에서 PyTorch 사용하기머신 러닝 시작하기네트워크에서 학습한 내용 보기요약
2. 컴퓨터 비전 소개
컴퓨터 비전의 작동 원리패션 MNIST 데이터베이스시각을 위한 뉴런신경망 설계하기전체 코드신경망 훈련하기모델 출력 살펴보기과적합조기 중지요약
3. 기본을 넘어서 Go: 이미지에서 특징 감지하기
컨볼루션풀링컨볼루션 신경망 구현하기컨볼루션 네트워크 살펴보기말과 사람을 구별하는 CNN 구축하기"말 또는 인간" 데이터 세트데이터 처리하기"말 또는 인간"을 위한 CNN 아키텍처"말 또는 인간" 데이터 세트에 유효성 검사 추가하기"말 또는 사람" 이미지 테스트하기이미지 증강전이 학습멀티클래스 분류드롭아웃 정규화요약
4. PyTorch로 데이터 사용하기
데이터 세트 시작하기FashionMNIST 클래스 살펴보기일반 데이터 집합 클래스ImageFolderDatasetFolderFakeData사용자 지정 분할 사용머신 러닝에서 데이터를 관리하기 위한 ETL 프로세스로드 단계 최적화하기데이터로더 클래스 사용하기일괄 처리셔플링병렬 데이터 로드사용자 정의 데이터 샘플링훈련 성능 향상을 위한 ETL 병렬화요약
5. 자연어 처리 소개
언어를 숫자로 인코딩하기토큰화 시작하기문장을 시퀀스로 전환하기중지어 제거 및 텍스트 정리하기HTML 태그 제거하기중지어 제거하기구두점 제거하기실제 데이터 소스로 작업하기텍스트 데이터 세트 가져오기CSV 파일에서 텍스트 가져오기JSON 파일에서 텍스트 가져오기요약
6. 임베딩을 사용하여 프로그래밍 가능한 감정 만들기
단어에서 의미 설정하기간단한 예제 양수 및 음수조금 더 깊이 들어가기: 벡터PyTorch에 임베딩하기임베딩을 사용하여 풍자 감지기 구축하기언어 모델에서 과적합 줄이기모든 것 종합하기모델을 사용하여 문장 분류하기임베딩 시각화하기사전 학습된 임베딩 사용요약
7. 자연어 처리를 위한 순환 신경망 7.
재귀의 기초언어에 대한 재귀 확장RNN으로 텍스트 분류기 생성하기LSTM 스태킹하기RNN으로 사전 훈련된 임베딩 사용하기요약
8. ML을 사용하여 텍스트 생성하기
시퀀스를 입력 시퀀스로 전환하기모델 만들기텍스트 생성하기다음 단어 예측하기예측을 조합하여 텍스트 생성하기데이터 세트 확장하기모델 아키텍처 개선하기차원 임베딩하기LSTM 초기화하기가변 학습률데이터 개선하기문자 기반 인코딩요약

9. 시퀀스 및 시계열 데이터 이해하기
시계열의 공통 속성트렌드계절성자동 상관 관계노이즈시계열 예측을 위한 기법기준선 생성을 위한 나이브 예측예측 정확도 측정덜 순진한 예측: 예측에 이동 평균 사용이동 평균 분석 개선하기요약
10. 시퀀스 예측을 위한 ML 모델 만들기
Windows 데이터 집합 만들기시계열 데이터 집합의 Windows 버전 만들기시퀀스 데이터에 맞게 DNN 생성 및 훈련하기DNN 결과 평가하기학습 속도 조정하기요약
11. 시퀀스 모델에 컨볼루션 및 반복 방법 사용하기
시퀀스 데이터의 컨볼루션컨볼루션 코딩하기Conv1D 하이퍼파라미터로 실험하기NASA 기상 데이터 사용Python에서 GISS 데이터 읽기시퀀스 모델링에 RNN 사용하기더 큰 데이터 집합 탐색다른 반복 방법 사용드롭아웃 사용양방향 RNN 사용하기요약
12. 추론의 개념
텐서이미지 데이터텍스트 데이터모델 밖의 텐서요약
13. 서빙을 위한 PyTorch 모델 호스팅하기
토치서브 소개TorchServe 설정하기환경 준비하기config.properties 파일 설정하기모델 정의하기핸들러 파일 만들기모델 아카이브 만들기서버 시작하기추론 테스트하기Go FurtherFlask로 서빙하기Flask를 위한 환경 만들기Python에서 Flask 서버 생성하기요약
14. 서드파티 모델과 허브 사용하기
허깅 페이스 허브허깅 페이스 허브 사용하기허깅 페이스 허브의 모델 사용하기PyTorch 허브PyTorch 비전 모델 사용하기자연어 처리기타 모델요약
15. 변압기 및 변압기
트랜스포머 이해하기인코더 아키텍처디코더 아키텍처인코더-디코더 아키텍처트랜스포머 API트랜스포머 시작하기핵심 개념파이프라인토큰화요약
16. 사용자 지정 데이터와 함께 LLM 사용
LLM 미세 조정하기설정 및 종속성데이터 로드 및 검사모델과 토큰화기 초기화하기데이터 전처리데이터 정렬메트릭 정의하기트레이닝 구성하기트레이너 초기화하기트레이닝 및 평가모델 저장 및 테스트LLM 프롬프트 튜닝하기(prompt-tuning)데이터 준비하기데이터 로더 생성하기모델 정의하기모델 훈련훈련 중 평가트레이닝 지표 보고하기프롬프트 임베딩 저장하기모델로 추론 수행하기요약
17. Ollama로 LLM 서비스하기
올라마 시작하기서버로 올라마 실행하기올라마 LLM을 사용하는 앱 빌드하기시나리오Python 개념 증명 구축하기Ollama용 웹 앱 만들기app.js 파일Index.html 파일요약
18. RAG 소개
RAG란 무엇인가요?RAG 시작하기유사성 이해하기데이터베이스 생성하기유사성 검색 수행하기모든 것 종합하기LLM으로 RAG 콘텐츠 사용하기호스팅 모델로 확장하기요약
19. 허깅 페이스 디퓨저로 제너레이티브 모델 사용하기
확산 모델이란 무엇인가요?허깅 페이스 디퓨저 사용하기디퓨저를 사용한 이미지 간 이미지디퓨저로 인페인팅하기요약
20. LoRA와 디퓨저로 제너레이티브 이미지 모델 튜닝하기
디퓨저로 LoRA 훈련하기디퓨저 가져오기LoRA 미세 조정을 위한 데이터 가져오기디퓨저로 모델 미세 조정하기모델 게시하기커스텀 LoRA로 이미지 생성하기요약
색인
저자 소개

Content preview from PyTorch의 코더를 위한 AI 및 ML

6장. 임베딩을 사용해 센티멘트를 프로그래밍 가능하게 만들기

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

5장에서는 단어를 가져와서 토큰으로 인코딩하는 방법을 살펴봤습니다. 그런 다음 단어로 가득 찬 문장을 토큰으로 가득 찬 시퀀스로 인코딩하고 적절하게 덧대거나 잘라내어 신경망을 훈련하는 데 사용할 수 있는 좋은 모양의 데이터 집합을 얻는 방법을 살펴봤습니다. 하지만 그 어느 것도 단어의 의미를 모델링하는 것은 아니었습니다. 그리고 의미를 캡슐화할 수 있는 절대적인 숫자 인코딩은 없지만 상대적인 인코딩은 존재합니다.

이 장에서는 의미를 캡슐화하는 기술, 특히 단어를 표현하기 위해 고차원 공간에 벡터를 만드는 임베딩의 개념에 대해 알아봅니다. 이러한 벡터의 방향은 말뭉치에서 단어의 용도에 따라 시간이 지남에 따라 학습할 수 있습니다. 그런 다음 문장이 주어지면 단어 벡터의 방향을 조사하여 합산하고, 합산된 전체적인 방향에서 단어의 산물로서 문장의 문맥을 파악할 수 있습니다. 또한 이와 관련하여 모델이 문장을 스캔할 때 문장 내 단어의 위치도 적절한 임베딩을 학습하는 데 도움이 될 수 있습니다.

이 장에서는 그 작동 방식에 대해서도 살펴보겠습니다. 5장의 풍자 감지를 위한 뉴스 헤드라인 데이터 세트를 사용하여 모델이 문장에서 풍자를 감지하는 데 도움이 되는 임베딩을 구축합니다. 또한 말뭉치의 단어가 벡터에 매핑되는 방식을 이해하는 데 도움이 되는 몇 가지 멋진 시각화 도구로 작업하여 어떤 단어가 전체 분류를 결정하는지 확인할 수 있습니다.

단어에서 의미 파악하기

임베딩을 위한 고차원 벡터에 대해 알아보기 전에 몇 가지 간단한 예를 통해 숫자에서 의미를 어떻게 도출할 수 있는지 시각화해 보겠습니다. 5장의 풍자 데이터 세트를 사용해 풍자적인 헤드라인을 구성하는 모든 단어를 양수로 인코딩하고 현실적인 헤드라인을 구성하는 단어를 음수로 인코딩하면 어떻게 될까요?

간단한 예제: 긍정과 부정

예를 들어 데이터 세트의 이 비꼬는 헤드라인을 살펴봅시다:

christian bale given neutered male statuette named oscar

어휘의 모든 단어가 0으로 시작한다고 가정하면, 이 문장의 각 단어의 값에 1을 더하면 다음과 같은 결과가 나옵니다:

{ "christian" : 1, "bale" : 1, "given" : 1, "neutered": 1, "male" : 1, 
  "statuette": 1, "named" : 1, "oscar": 1}

참고

이것은 지난 장에서 했던 단어의 토큰화와는 다릅니다. 각 단어(예: christian)를 말뭉치에서 인코딩된 해당 단어를 나타내는 토큰으로 대체하는 것을 고려할 수도 있지만, 코드를 더 쉽게 읽을 수 있도록 지금은 단어를 그대로 두겠습니다.

그런 다음 다음 단계에서는 다음과 같이 비꼬는 문장이 아닌 평범한 헤드라인을 생각해 보세요:

gareth bale scores wonder goal

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341662605

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

PyTorch의 코더를 위한 AI 및 ML

by Laurence Moroney

6장. 임베딩을 사용해 센티멘트를 프로그래밍 가능하게 만들기

단어에서 의미 파악하기

간단한 예제: 긍정과 부정

참고

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

실무로 통하는 ML 문제 해결 with 파이썬

AI 에이전트를 위한 메모리 관리

AI 시스템 성능 엔지니어링 (Korean Edition)

생성형 AI를 위한 프롬프트 엔지니어링

Publisher Resources

6장. 임베딩을 사용해 센티멘트를 프로그래밍 가능하게 만들기

단어에서 의미 파악하기

간단한 예제: 긍정과 부정

참고

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

실무로 통하는 ML 문제 해결 with 파이썬

AI 에이전트를 위한 메모리 관리

AI 시스템 성능 엔지니어링 (Korean Edition)

생성형 AI를 위한 프롬프트 엔지니어링

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.