Skip to Content
LLM 서비스 및 최적화 실습하기 (Korean Edition)
book

LLM 서비스 및 최적화 실습하기 (Korean Edition)

by Chi Wang, Peiheng Hu
May 2026
Intermediate
374 pages
6h 40m
Korean
O'Reilly Media, Inc.
Content preview from LLM 서비스 및 최적화 실습하기 (Korean Edition)

제1장. 모델 서빙 및 최적화소개

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

지난 10년 동안 AI 시스템은 오프라인 연구용 프로토타입에서 일상적인 제품에 내장된 실시간 사용자 대응 기능으로 진화했습니다. 현대적인 AI 워크플로는 데이터 수집과 모델 훈련부터 배포, 모니터링, 지속적인 반복에 이르기까지 전체 라이프사이클을 아우르며, Deep Learning과 LLMs의 부상으로 이 라이프사이클은 극적으로 가속화되었습니다. 점점 더 강력한 모델을 훈련하는 데 많은 관심이 쏠리고 있지만, 프로덕션 환경에서 이러한 모델을 안정적이고 효율적으로 제공하는 것 또한 그만큼 중요해졌습니다.

본질적으로 모델 서빙은 AI 모델을 최종 사용자, 애플리케이션 및 시스템이 이용할 수 있도록 하는 과제를 해결하는 프로세스로 , API, 웹 서비스 또는 통합 워크플로를 통해 작동하여 이전에 본 적 없는 새로운 데이터에 대해 예측( 추론이라고 함)을 생성합니다.

간단한 비유를 들자면, 고객에게 AI 기능을 제공하든 운영 효율성을 높이든 모든 종류의 비즈니스에 있어 모델 서빙은 일종의 공급망입니다. 훈련된 모델은 적절한 지연 시간, 신뢰성, 비용 특성을 갖추고 사용자에게 전달되지 않는 한 비즈니스적 가치가 거의 없습니다. 예를 들어, Amazon과 넷플릭스는 사용자가 콘텐츠를 탐색할 때 고객 추천을 즉시 업데이트하기 위해 모델 서빙을 사용합니다. 은행은 온라인 쇼핑 결제 시 사기 거래를 차단하기 위해 모델 서빙을 활용하며, 항공사 챗봇은 실시간 항공편 업데이트와 재예약 옵션을 제공하기 위해 이를 사용합니다. 이러한 기업들의 경우 모델 서빙 시스템이 중단되면 비즈니스가 멈춰버립니다.

모든 제조업체가 효율적이고 비용 효율적인 공급망을 추구하는 것처럼, AI 기업들도 프로덕션 환경에서 모델과 하드웨어를 효율적이고 효과적으로 활용하고자 합니다. 따라서 올바른 모델 서빙 방식을 선택하고 이를 최적화하는 것은 매우 중요합니다. 이는 기업의 생명선과 운영 비용에 직접적인 영향을 미치기 때문입니다. 어떤 역할을 맡고 있든, AI 업계에 종사한다면 모델 서빙에 대한 지식을 갖추는 것이 도움이 될 것입니다.

10년 넘게 모델 서빙 인프라를 다뤄온 기술 리더로서, 우리는 연구원, 개발자, 경영진, 마케팅 담당자, 고객, 학생 등 이 분야의 다양한 관계자들과 협력해 왔습니다. 우리는 사람들이 모델 서빙을 처음 이해하려고 할 때 종종 위축되거나 압도감을 느낀다는 사실을 발견했습니다. 여기에는 세 가지 주요 이유가 있습니다. 첫째, 이미 모델 훈련에 대한 깊은 지식이 있어야 합니다. 둘째, 아직까지 입문 튜토리얼에서 세계적 수준의 서빙 시스템 관리에 이르는 명확한 학습 경로가 마련되어 있지 않습니다. 셋째, 프레임워크, 라이브러리, 벤더 및 기타 엔지니어링 옵션이 너무 많아 어떤 것을 채택할지 결정하기 어려울 수 있습니다. 이 책은 모델 서빙과 최적화에 대한 체계적이고 실용적인 가이드를 제공함으로써 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

What Successful Brick-and-Mortar Retailers Get Right

What Successful Brick-and-Mortar Retailers Get Right

Rob Angell
The Human Factor in AI-Based Decision-Making

The Human Factor in AI-Based Decision-Making

Philip Meissner, Christoph Keding
What Successful Project Managers Do

What Successful Project Managers Do

W. Scott Cameron, Jeffrey S. Russell, Edward J. Hoffman, Alexander Laufer

Publisher Resources

ISBN: 0642572383671