Skip to Content
엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)
book

엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

by Alex Soto Bueno, Markus Eisele, Natale Vinto
November 2025
Beginner to intermediate
430 pages
6h 48m
Korean
O'Reilly Media, Inc.
Content preview from 엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

제5장. 임베딩 벡터, 벡터 저장소 및 로컬 모델 실행

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이 장에서는 거의 모든 AI 기반 애플리케이션의 기초를 이루는 세 가지 핵심 개념을 소개합니다: 임베딩 벡터, 벡터 저장소, 그리고 검색 강화 생성(retrieval-augmented generation)이라는 아키텍처에서 증강된 쿼리와 결합된 형태입니다. 또한 로컬 모델 추론에 대해 자세히 설명합니다. 우리는 로컬 LLMs의 실용적 활용과 Java 기반 도구 및 프레임워크를 통해 이를 상호작용하는 방법에 중점을 둡니다. 특히 개발자에게 이는 로컬 머신에서 애플리케이션에 AI 기능을 효과적으로 통합하는 데 필수적입니다.

임베딩이 원시 입력에서 의미적 의미를 어떻게 포착하는지, 벡터 저장소가 효율적인 유사도 기반 검색을 어떻게 가능하게 하는지, 그리고 이러한 구성 요소들이 LLMs과 어떻게 통합되어 의미적 검색, 분류, 장문맥 기억과 같은 기능을 지원하는지 배울 것입니다. 성능, 비용, 프라이버시 또는 오프라인 요구 사항을 위해 이러한 기능을 로컬에서 실행하는 데 중점을 둡니다.

이 장은 책의 나머지 부분에서 진행될 실습 구현을 준비하는 기초 장입니다. 임베딩과 로컬 추론이 서로 어떻게 연관되는지에 대한 필수적인 이해를 구축하여, 이후 장에서 Java 애플리케이션에 자신 있게 적용할 수 있도록 합니다.

임베딩 벡터와 그 역할

이전에 LLMs이 데이터를 추론하려면 이를 해석할 방법이 필요합니다. 이를 위해 숫자를 사용합니다. 바로 이 때문에 임베딩 벡터에 대해 논의해야 합니다. 이 섹션에서는 임베딩이 무엇인지, 왜 중요한지, 그리고 의미론적 검색, 추천 시스템, 분류, 대화형 기억과 같은 작업을 어떻게 가능하게 하는지 배울 것입니다.

먼저 동기를 살펴보겠습니다: 키워드 검색과 같은 전통적인 접근 방식이 왜 충분하지 않은지, 그리고 임베딩이 음절뿐만 아니라 의미를 밀도 높은 수학적 형식으로 포착함으로써 이 문제를 어떻게 해결하는지 알아봅니다. 그런 다음 임베딩 벡터의 구조와 코사인 유사도 및 내적과 같은 유사도 측정법을 사용하여 이러한 벡터를 비교하는 방법을 탐구합니다.

이어서 Word2Vec, GloVE(Global Vectors for Word Representation)부터 BERT(Bidirectional Encoder Representations from Transformers) 변형 모델 및 문장 수준 모델에 이르기까지 일반적인 임베딩 모델들을 살펴보겠습니다. 각 모델의 역량에 대해 논의하고 어떤 상황에서 어떤 모델을 선택해야 하는지 결정하는 데 도움을 드릴 것입니다. 또한 토큰화 방식, 임베딩 차원, 아키텍처 고려 사항 등 LLMs과 임베딩을 결합할 때 모델 호환성을 평가하는 방법도 배울 수 있습니다.

본 섹션 후반부는 실용적 응용에 집중합니다. 임베딩을 활용한 클러스터링, 분류, 개인화, 이상 탐지, 대화 맥락 유지 방법 등을 보여드립니다. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

AI 시스템 성능 엔지니어링 (Korean Edition)

AI 시스템 성능 엔지니어링 (Korean Edition)

Chris Fregly
생성형 AI를 위한 프롬프트 엔지니어링

생성형 AI를 위한 프롬프트 엔지니어링

제임스 피닉스, 마이크 테일러
AI 에이전트를 위한 메모리 관리

AI 에이전트를 위한 메모리 관리

Benjamin Labaschin, Jim Allen Wallace, Andrew Brookins, Manvinder Singh

Publisher Resources

ISBN: 0642572279882