book

엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

Name: 엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)
ISBN: 0642572279882

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Beginner to intermediate

430 pages

6h 48m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
프로토타입을 넘어: Java로 구축하는 탄력적인 AI 기반 애플리케이션이 책을 읽어야 할 대상책의 구성필수 지식 및 소프트웨어이 책에서 사용된 표기법코드 예제 활용O’Reilly 온라인 학습문의 방법감사의 말알렉스Markus나탈레
1. 기업 AI의 딜레마
AI 환경: 기술적 관점 GenAI까지의 여정기계 학습: 오늘날 AI의 기초Deep Learning: AI 무기고의 강력한 도구생성형 AI: 콘텐츠 생성의 미래오픈소스 모델과 훈련 데이터오픈 소스가 생성형 AI의 중요한 동인인 이유나쁜 데이터의 숨겨진 비용: 훈련 입력 데이터를 통한 모델 행동 이해LLMs에 기업별 데이터 추가하기설명 가능하고 투명한 AI 의사 결정윤리적 및 지속가능성 고려 사항LLMs의 수명 주기와 행동에 영향을 미치는 방법MLOps 대 DevOps (그리고 AIOps 및 GenAIOps의 부상)결론
2. 새로운 유형의 애플리케이션
대규모 언어 모델 이해하기대규모 언어 모델의 핵심 요소모델 배포애플리케이션에 적합한 LLM 선택하기모델 유형모델 규모와 효율성배포 접근법지원되는 정밀도 및 하드웨어 최적화윤리적 고려 사항 및 편향커뮤니티 및 문서 지원폐쇄형 대 오픈 소스예시 분류파운데이션 모델 또는 전문가 모델: 우리는 어디로 향하고 있는가?지원 기술 활용하기임베딩 모델과 벡터 데이터베이스캐싱 및 성능 최적화AI 에이전트 프레임워크모델 컨텍스트 프로토콜API 통합모델 보안, 규정 준수 및 접근 제어결론
3. 개발자를 위한 prompt: AI 기반 애플리케이션에서 prompt가 중요한 이유
prompt 유형사용자 prompt: 사용자의 직접 입력시스템 prompt: 모델 행동을 안내하는 지침컨텍스트 prompt: 사전 채워지거나 동적으로 생성된 입력효과적인 prompt 작성 원칙prompting 기법제로샷 prompt: 컨텍스트 없이 질문하기소량 데이터 prompt: 응답을 안내하기 위한 예시 제공사유 연쇄 prompting: 단계별 추론을 유도자기 일관성: 다중 응답 생성으로 정확도 향상명령 prompt: 모델에 대한 명시적 지시검색 강화 생성: 외부 데이터로 prompt 강화고급 전략동적 prompt 구성: 정적 입력과 생성된 입력 결합프롬프트 체이닝을 통한 컨텍스트 유지안전한 출력을 위한 가드레일 및 검증 활용prompt 맞춤화를 위한 API 활용성능 대 비용 최적화prompt 디버깅: 불량 응답 문제 해결도구 사용과 함수 호출새로운 prompt 엔지니어링으로서의 컨텍스트 엔지니어링컨텍스트를 위한 메모리 및 스토리지 설계인메모리 캐시를 통한 빠른 접근단기 컨텍스트를 위한 핫 메모리장기적 의미 기억을 위한 벡터 데이터베이스보관 데이터 및 대규모 저장소를 위한 콜드 스토리지효과적인 컨텍스트 전달을 위한 스토리지 계층 결합결론
4. 애플리케이션을 위한 AI 아키텍처
기존 아키텍처를 넘어: AI 기반 시스템이 새로운 접근법을 요구하는 이유핵심 아키텍처 기둥 개요: 본 장의 로드맵애플리케이션 구성 요소쿼리와 데이터: 애플리케이션 입력 관리AI 게이트웨이: 입력 및 출력 관리컨텍스트와 메모리상호작용 및 전송: 도구와 에이전트 활용탐색 및 접근 제어모델 서비스데이터 준비 파이프라인가시성 및 모니터링: 엔드투엔드 AI 스택결론
5. 임베딩 벡터, 벡터 저장소, 그리고 로컬 모델 실행
벡터 임베딩과 그 역할임베딩이 필요한 이유는 무엇인가?임베딩 벡터의 구조유사도 측정: 코사인 유사도와 거리일반적인 임베딩 모델AI 애플리케이션에서 임베딩은 어떻게 사용되나요?기타 유사도 측정 방법임베딩 벡터의 비전통적 활용벡터 저장소 및 쿼리 메커니즘벡터 데이터베이스가 임베딩을 저장하고 검색하는 방법일반적인 벡터 저장소의 예시검색 강화 생성대규모 인덱싱 또는 벡터 임베딩 생성모델을 로컬에서 실행하는 이유Ollama: 간단한 인터페이스로 로컬 추론 수행Podman Desktop: AI 워크로드를 위한 컨테이너화된 환경 활용Jlama: JVM 기반 애플리케이션을 위한 Java 네이티브 모델 추론로컬 추론 방법 비교OpenAI의 REST API 사용OpenAI 모델 및 엔드포인트 개요OpenAI API를 통한 임베딩 생성결론
6. 추론 API
추론 API란 무엇인가?추론 API의 이점추론 API 예시Java에서 추론 모델 배포하기DJL을 통한 모델 추론내부 구조 살펴보기gRPC를 통한 모델 추론결론
7. Java를 통한 추론 모델 접근
Quarkus를 사용한 추론 API 연결아키텍처사기 추론 APIQuarkus 프로젝트REST 클라이언트 인터페이스REST 리소스예제 테스트Spring Boot WebClient를 사용한 추론 API 연결WebClient 종속성 추가WebClient 사용Quarkus gRPC 클라이언트를 사용한 추론 API 연결gRPC 종속성 추가gRPC 클라이언트 구현결론
8. LangChain4j
LangChain4j란 무엇인가요?통합 APIprompt 템플릿구조화된 출력메모리데이터 보강도구고수준 API순수 Java를 사용한 LangChain4j비정형 텍스트에서 정보 추출텍스트 분류 수행이미지 및 설명 생성Spring Boot 통합Spring Boot 종속성 추가AI 서비스 정의REST 컨트롤러 생성Quarkus 통합Quarkus 종속성프론트엔드AI 서비스웹 소켓광학 문자 인식도구의존성라이드 지속성대기 시간 서비스AI 서비스REST 엔드포인트동적 툴링도구에 관한 최종 참고 사항메모리의존성코드 변경 사항결론
9. 벡터 임베딩 및 저장소
벡터 임베딩 계산DJL을 사용한 벡터 임베딩프로세스 내 LangChain4j를 사용한 벡터 임베딩LangChain4j를 사용한 원격 모델을 통한 벡터 임베딩텍스트 분류기텍스트 분류 임베딩 종속성예시 제공 및 입력 분류텍스트 클러스터링텍스트 클러스터링 종속성 추가헤드라인 뉴스 읽기벡터 임베딩 계산뉴스 클러스터링뉴스 헤드라인 요약시맨틱 검색의미적 검색 종속성 추가영화 가져오기유사성 검색시맨틱 캐시RAG인제스트검색재순위 지정쿼리 라우터인제스트 분할 창결과 필터링결론

10. LangGraph4j
LangGraph4j에서 그래프 이해하기노드에지상태LangGraph4j 사용하기상태 정의노드 정의그래프 정의하기조건부 에지 추가값 추가하기LangChain4j와 LangGraph4j 함께 사용하기에이전트 라우팅LangGraph4j와의 인간 상호작용자기 성찰을 통한 고급 RAG 스키마추가 기능 살펴보기서브그래프병렬 실행시간 여행결론
11. 이미지 처리
OpenCV라이브러리 초기화이미지 로드 및 저장기본 변환 수행요소 오버레이이미지 처리바코드 및 QR 코드 읽기스트림 처리동영상 처리웹캠 이미지 처리OpenCV와 JavaOCR결론
12. AI Java 개발의 고급 주제
스트리밍저수준 API를 통한 스트리밍AI 서비스를 통한 스트리밍LangChain4j 및 스트리밍 통합 사용가드레일입력 가드레일출력 가드레일가드레일 사용 사례모델 컨텍스트 프로토콜MCP 아키텍처Java를 사용한 MCP 클라이언트Quarkus를 사용한 MCP 클라이언트Quarkus 기반 MCP 서버MCP의 주요 이점다음 단계
목차
저자 소개

Content preview from 엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

제12장. AI Java 개발의고급 주제

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이전 장들에서 살펴본 바와 같이, LangChain4j 및 LangGraph4j와 같은 도구 덕분에 Java를 활용한 AI 애플리케이션 개발 환경은 크게 진화했습니다. 지금까지 여러분은 지능형 챗봇을 구축하고, 벡터 저장소를 탐색하며, AI 워크플로를 조정하고, 심지어 애플리케이션에 이미지 인식 기능을 통합해 보았습니다. 그러나 이제 생산 환경에 적합하고 안전하며 확장 가능한 AI 시스템으로 나아가기 위해 몇 가지 고급 주제를 더 탐구해야 합니다.

이 장에서는 기능성 프로토타입에서 견고한 엔터프라이즈급 솔루션으로 AI 애플리케이션을 한 단계 끌어올리는 마지막 핵심 도구들을 제공합니다. 앞으로의 내용에서는 세 가지 강력한 기능을 살펴보겠습니다:

스트림: 애플리케이션은 모델이 완전한 응답을 생성할 때까지 기다리지 않고, 모델이 생성하는 대로 응답을 점진적으로 수신합니다.
가드레일: 이러한 안전 장치를 사용하여 LLM의 입력/출력이 요구 사항에 부합하는지 확인할 수 있습니다.
모델 컨텍스트 프로토콜: 이 개방형 표준은 애플리케이션이 언어 모델과 상호 작용하는 방법, 특히 컨텍스트, 도구 및 메모리 관리에 관한 방법을 정의합니다.

각 기능은 현대 AI 애플리케이션의 핵심 기둥인 품질, 복원력, 유지 보수성을 강화합니다. LangChain4j를 활용하여 이러한 기능을 어떻게 활용하여 Java AI 솔루션을 미래에 대비할 수 있는지 살펴보겠습니다.

스트리밍

LLMs 은 텍스트를 점진적으로(토큰 단위로) 생성합니다. 이러한 이유로 많은 모델 제공업체는 사용자가 전체 완료를 기다릴 필요 없이 실시간 스트리밍 응답을 지원합니다.

이를 통해 사용자는 예측할 수 없는 지연에 직면하지 않고 거의 즉시 출력을 읽기 시작할 수 있으므로 더 원활한 경험을 할 수 있습니다. 이는 챗봇을 구현하고 사용자에게 빠른 피드백을 제공하는 매우 편리한 방법입니다.

LangChain4j 저수준 API를 사용하여 응답 스트리밍의 첫 번째 예제를 구현해 보겠습니다.

저수준 API를 통한 스트리밍

에서 가장 먼저 눈에 띄는 변경점 은 ChatModel 인터페이스 대신 dev.langchain4j.model.chat.Stream⁠ingChatModel 인터페이스의 사용입니다. 모델 종속성을 추가하고 구체적인 빌더를 사용하여 StreamingChatModelChatModel 인스턴스와 유사한 코드로 인스턴스를 생성합니다. 모델 종속성을 추가하고 구체적인 빌더를 사용하면 됩니다. 예를 들어 OpenAI의 경우 dev.langchain4j.model.openai.OpenAiStreamingChatModel 클래스를 사용합니다:

StreamingChatModel model = OpenAiStreamingChatModel.builder() 
 .apiKey("demo")
 .baseUrl("http://langchain4j.dev/demo/openai/v1 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572279882

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design