book

엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

Name: 엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)
ISBN: 0642572279882

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Beginner to intermediate

430 pages

6h 48m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
프로토타입을 넘어: Java로 구축하는 탄력적인 AI 기반 애플리케이션이 책을 읽어야 할 대상책의 구성필수 지식 및 소프트웨어이 책에서 사용된 표기법코드 예제 활용O’Reilly 온라인 학습문의 방법감사의 말알렉스Markus나탈레
1. 기업 AI의 딜레마
AI 환경: 기술적 관점 GenAI까지의 여정기계 학습: 오늘날 AI의 기초Deep Learning: AI 무기고의 강력한 도구생성형 AI: 콘텐츠 생성의 미래오픈소스 모델과 훈련 데이터오픈 소스가 생성형 AI의 중요한 동인인 이유나쁜 데이터의 숨겨진 비용: 훈련 입력 데이터를 통한 모델 행동 이해LLMs에 기업별 데이터 추가하기설명 가능하고 투명한 AI 의사 결정윤리적 및 지속가능성 고려 사항LLMs의 수명 주기와 행동에 영향을 미치는 방법MLOps 대 DevOps (그리고 AIOps 및 GenAIOps의 부상)결론
2. 새로운 유형의 애플리케이션
대규모 언어 모델 이해하기대규모 언어 모델의 핵심 요소모델 배포애플리케이션에 적합한 LLM 선택하기모델 유형모델 규모와 효율성배포 접근법지원되는 정밀도 및 하드웨어 최적화윤리적 고려 사항 및 편향커뮤니티 및 문서 지원폐쇄형 대 오픈 소스예시 분류파운데이션 모델 또는 전문가 모델: 우리는 어디로 향하고 있는가?지원 기술 활용하기임베딩 모델과 벡터 데이터베이스캐싱 및 성능 최적화AI 에이전트 프레임워크모델 컨텍스트 프로토콜API 통합모델 보안, 규정 준수 및 접근 제어결론
3. 개발자를 위한 prompt: AI 기반 애플리케이션에서 prompt가 중요한 이유
prompt 유형사용자 prompt: 사용자의 직접 입력시스템 prompt: 모델 행동을 안내하는 지침컨텍스트 prompt: 사전 채워지거나 동적으로 생성된 입력효과적인 prompt 작성 원칙prompting 기법제로샷 prompt: 컨텍스트 없이 질문하기소량 데이터 prompt: 응답을 안내하기 위한 예시 제공사유 연쇄 prompting: 단계별 추론을 유도자기 일관성: 다중 응답 생성으로 정확도 향상명령 prompt: 모델에 대한 명시적 지시검색 강화 생성: 외부 데이터로 prompt 강화고급 전략동적 prompt 구성: 정적 입력과 생성된 입력 결합프롬프트 체이닝을 통한 컨텍스트 유지안전한 출력을 위한 가드레일 및 검증 활용prompt 맞춤화를 위한 API 활용성능 대 비용 최적화prompt 디버깅: 불량 응답 문제 해결도구 사용과 함수 호출새로운 prompt 엔지니어링으로서의 컨텍스트 엔지니어링컨텍스트를 위한 메모리 및 스토리지 설계인메모리 캐시를 통한 빠른 접근단기 컨텍스트를 위한 핫 메모리장기적 의미 기억을 위한 벡터 데이터베이스보관 데이터 및 대규모 저장소를 위한 콜드 스토리지효과적인 컨텍스트 전달을 위한 스토리지 계층 결합결론
4. 애플리케이션을 위한 AI 아키텍처
기존 아키텍처를 넘어: AI 기반 시스템이 새로운 접근법을 요구하는 이유핵심 아키텍처 기둥 개요: 본 장의 로드맵애플리케이션 구성 요소쿼리와 데이터: 애플리케이션 입력 관리AI 게이트웨이: 입력 및 출력 관리컨텍스트와 메모리상호작용 및 전송: 도구와 에이전트 활용탐색 및 접근 제어모델 서비스데이터 준비 파이프라인가시성 및 모니터링: 엔드투엔드 AI 스택결론
5. 임베딩 벡터, 벡터 저장소, 그리고 로컬 모델 실행
벡터 임베딩과 그 역할임베딩이 필요한 이유는 무엇인가?임베딩 벡터의 구조유사도 측정: 코사인 유사도와 거리일반적인 임베딩 모델AI 애플리케이션에서 임베딩은 어떻게 사용되나요?기타 유사도 측정 방법임베딩 벡터의 비전통적 활용벡터 저장소 및 쿼리 메커니즘벡터 데이터베이스가 임베딩을 저장하고 검색하는 방법일반적인 벡터 저장소의 예시검색 강화 생성대규모 인덱싱 또는 벡터 임베딩 생성모델을 로컬에서 실행하는 이유Ollama: 간단한 인터페이스로 로컬 추론 수행Podman Desktop: AI 워크로드를 위한 컨테이너화된 환경 활용Jlama: JVM 기반 애플리케이션을 위한 Java 네이티브 모델 추론로컬 추론 방법 비교OpenAI의 REST API 사용OpenAI 모델 및 엔드포인트 개요OpenAI API를 통한 임베딩 생성결론
6. 추론 API
추론 API란 무엇인가?추론 API의 이점추론 API 예시Java에서 추론 모델 배포하기DJL을 통한 모델 추론내부 구조 살펴보기gRPC를 통한 모델 추론결론
7. Java를 통한 추론 모델 접근
Quarkus를 사용한 추론 API 연결아키텍처사기 추론 APIQuarkus 프로젝트REST 클라이언트 인터페이스REST 리소스예제 테스트Spring Boot WebClient를 사용한 추론 API 연결WebClient 종속성 추가WebClient 사용Quarkus gRPC 클라이언트를 사용한 추론 API 연결gRPC 종속성 추가gRPC 클라이언트 구현결론
8. LangChain4j
LangChain4j란 무엇인가요?통합 APIprompt 템플릿구조화된 출력메모리데이터 보강도구고수준 API순수 Java를 사용한 LangChain4j비정형 텍스트에서 정보 추출텍스트 분류 수행이미지 및 설명 생성Spring Boot 통합Spring Boot 종속성 추가AI 서비스 정의REST 컨트롤러 생성Quarkus 통합Quarkus 종속성프론트엔드AI 서비스웹 소켓광학 문자 인식도구의존성라이드 지속성대기 시간 서비스AI 서비스REST 엔드포인트동적 툴링도구에 관한 최종 참고 사항메모리의존성코드 변경 사항결론
9. 벡터 임베딩 및 저장소
벡터 임베딩 계산DJL을 사용한 벡터 임베딩프로세스 내 LangChain4j를 사용한 벡터 임베딩LangChain4j를 사용한 원격 모델을 통한 벡터 임베딩텍스트 분류기텍스트 분류 임베딩 종속성예시 제공 및 입력 분류텍스트 클러스터링텍스트 클러스터링 종속성 추가헤드라인 뉴스 읽기벡터 임베딩 계산뉴스 클러스터링뉴스 헤드라인 요약시맨틱 검색의미적 검색 종속성 추가영화 가져오기유사성 검색시맨틱 캐시RAG인제스트검색재순위 지정쿼리 라우터인제스트 분할 창결과 필터링결론

10. LangGraph4j
LangGraph4j에서 그래프 이해하기노드에지상태LangGraph4j 사용하기상태 정의노드 정의그래프 정의하기조건부 에지 추가값 추가하기LangChain4j와 LangGraph4j 함께 사용하기에이전트 라우팅LangGraph4j와의 인간 상호작용자기 성찰을 통한 고급 RAG 스키마추가 기능 살펴보기서브그래프병렬 실행시간 여행결론
11. 이미지 처리
OpenCV라이브러리 초기화이미지 로드 및 저장기본 변환 수행요소 오버레이이미지 처리바코드 및 QR 코드 읽기스트림 처리동영상 처리웹캠 이미지 처리OpenCV와 JavaOCR결론
12. AI Java 개발의 고급 주제
스트리밍저수준 API를 통한 스트리밍AI 서비스를 통한 스트리밍LangChain4j 및 스트리밍 통합 사용가드레일입력 가드레일출력 가드레일가드레일 사용 사례모델 컨텍스트 프로토콜MCP 아키텍처Java를 사용한 MCP 클라이언트Quarkus를 사용한 MCP 클라이언트Quarkus 기반 MCP 서버MCP의 주요 이점다음 단계
목차
저자 소개

Content preview from 엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

제6장. 추론 API

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

에서 이미 AI와 다양한 모델 유형에 대한 지식을 확장했습니다. 또한 가능한 경우 이러한 모델을 로컬에 배포하고 쿼리로 테스트했습니다. 하지만 모델을 사용할 때는 모델을 적절히 노출하고 조직의 모범 사례를 따르며 개발자가 모델을 쉽게 활용할 수 있는 방법을 제공해야 합니다.

추론 API는 이러한 문제를 해결하여 모든 개발자가 모델에 접근할 수 있도록 합니다. 이 장에서는 Java에서 추론 API를 사용하여 AI/ML 모델을 노출하는 방법을 살펴봅니다.

추론 API란 무엇인가?

추론 API는 머신러닝( ) 개발자가 HTTP, gRPC, Kafka 등 어떤 프로토콜로든 데이터를 머신러닝 모델이 배포된 서버로 전송하고, 결과로 예측값이나 분류 결과를 받을 수 있게 합니다. 실제로 OpenAI나 Gemini 같은 클라우드 모델이나 Ollama를 사용해 로컬에 배포한 모델에 접근할 때마다, 여러분은 그들의 추론 API를 통해 그렇게 합니다.

요즘에는 Google, IBM, Meta 같은 대기업이 훈련한 대규모 모델을 주로 LLM 목적으로 사용하는 것이 일반적이지만, 비즈니스의 특정 문제를 해결하기 위해 소규모 맞춤형 훈련 모델을 사용해야 할 수도 있습니다. 일반적으로 이러한 모델은 조직의 데이터 과학자가 개발하며, 이를 추론하기 위한 코드를 개발해야 합니다.

예를 들어, 은행에서 근무 중이며 데이터 과학자들이 신용카드 거래 사기 여부를 탐지하는 맞춤형 모델을 훈련시켰다고 가정해 보겠습니다. 이 모델은 ONNX 형식의 예측 AI 모델로, 6개의 입력 매개변수와 float 유형의 1개 출력 매개변수를 가집니다.

입력 매개변수는 다음과 같습니다:

distance_from_last_transaction: 마지막 거래 발생 시점으로부터의 시간적 거리. 예: 0.3111400080477545.
ratio_to_median_price: 구매 가격 거래가 중간 구매 가격 대비 차지하는 비율. 예: 1.9459399775518593.
used_chip: 칩을 통해 거래가 이루어졌는지 여부를 나타냅니다: 칩을 사용한 경우( true ) 1.0, 칩을 사용하지 않은 경우( false) 0.0.
used_pin_number: 거래가 PIN 번호로 이루어졌는지 여부를 나타냅니다: true 인 경우 1.0, false 인 경우 0.0.
online_order: 거래가 온라인 주문인지 여부를 나타냅니다: true 인 경우 1.0, false 인 경우 0.0.

그리고 출력 매개변수는 다음과 같습니다:

prediction: 거래가 사기일 확률. 예: 0.9625362.

몇 가지 세부 사항을 확인할 수 있습니다:

used_chip 필드와 같이 부울 값을 참조할 때도 모든 값은 부동 소수점 형식입니다.
출력은 확률이지만, 비즈니스 관점에서는 사기가 발생했는지 여부를 알고 싶어 합니다.
개발자는 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572279882

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

엔터프라이즈 Java 개발을 위한 응용 AI (Korean Edition)

by Alex Soto Bueno, Markus Eisele, Natale Vinto

제6장. 추론 API

추론 API란 무엇인가?

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.