book

LLMOps

Name: LLMOps
Author: Abi Aryan
ISBN: 9798341663824

by Abi Aryan

July 2025

Beginner to intermediate

284 pages

4h 39m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
이 책에서 사용된 규칙오라일리 온라인 학습문의 방법감사의 말
1. 대규모 언어 모델 소개
몇 가지 주요 용어트랜스포머 모델대규모 언어 모델LLM 아키텍처인코더 전용 LLMs디코더 전용 LLMs인코더-디코더 LLMs상태 공간 아키텍처소규모 언어 모델LLM 선택하기LLM 선택 시 고려 사항큰 논쟁 오픈 소스 대 독점 LLM 비교LLM의 엔터프라이즈 사용 사례지식 검색번역음성 합성추천 시스템자율 AI 에이전트에이전트 시스템LLM을 사용한 구축의 10가지 과제1. 크기 및 복잡성2. 훈련 규모 및 기간3. 프롬프트 엔지니어링4. 추론 지연 시간 및 처리량5. 윤리적 고려 사항6. 리소스 확장 및 오케스트레이션7. 통합 및 도구 키트8. 광범위한 적용 가능성9. 개인 정보 보호 및 보안10. 비용결론참조
2. LLMOps 소개
운영 프레임워크란 무엇인가요?MLOps에서 LLMOps로: 새로운 프레임워크가 필요한 이유는 무엇인가요?LLMOps의 네 가지 목표LLMOps 팀과 역할LLMOps 엔지니어의 역할하루 일과외부에서 LLMOps 엔지니어 채용하기내부적으로 채용하기 MLOps 엔지니어를 LLMOps 엔지니어로 업스킬링하기LLM과 조직LLMOps의 네 가지 목표신뢰성확장성견고성보안LLMOps 성숙도 모델결론참조추가 자료
3. LLM 기반 응용 프로그램
애플리케이션에서 AI 모델 사용하기인프라 애플리케이션에이전트 워크플로모델 컨텍스트 프로토콜에이전트 간 프로토콜vLLM 및 멀티모달 LLM의 부상LLMOps 관련 질문애플리케이션 성능 모니터링소비자 LLM 애플리케이션의 성능 측정하기애플리케이션에 가장 적합한 모델 선택하기기타 애플리케이션 메트릭LLM 기반 애플리케이션에서 무엇을 제어할 수 있나요?프롬프트 엔지니어링은 "어렵다"프롬프트 엔지니어링이 더 나은 결과를 가져왔나요?"더 어려워진" LLM 기반 인프라 시스템결론참고 자료
4. LLM을 위한 데이터 엔지니어링
데이터 엔지니어링과 LLM의 부상데이터 운영 엔지니어의 역할데이터 관리합성 데이터LLM 파이프라인LLM 훈련하기데이터 구성스케일링 법칙데이터 반복데이터 품질LLM을 위한 일반적인 데이터 전처리 파이프라인1단계: 데이터 카탈로그화2단계: 개인정보 보호 및 법률 준수 확인3단계: 데이터 필터링4단계: 데이터 중복 제거 수행5단계: 데이터 수집6단계: 인코딩 감지7단계: 언어 감지8단계: 청킹9단계: 데이터 백업10단계 유지 관리 및 업데이트 수행벡터화벡터 데이터베이스최신 데이터 유지 관리하기미세 조정 데이터 세트 생성하기인스트럭션 미세 조정 데이터 세트 자동 생성하기결론참고 자료추가 자료
5. LLM 기반 애플리케이션을 위한 모델 도메인 적응
처음부터 LLM 훈련하기1단계: 작업 선택2단계: 데이터 준비3단계: 모델 아키텍처 결정4단계: 트레이닝 인프라 설정5단계: 트레이닝 구현모델 앙상블 접근 방식모델 평균화 및 블렌딩가중 앙상블스택형 앙상블(2단계 모델)견고함을 위한 다양한 앙상블다단계 디코딩 및 투표 메커니즘컴포저빌리티소프트 액터-크리틱모델 도메인 적응프롬프트 엔지니어링원샷 프롬프트소수 샷 프롬프트체인 오브 씽크 프롬프트검색-증강 생성시맨틱 커널미세 조정적응형 미세 조정어댑터(단일, 병렬 및 확장 병렬)동작 미세 조정접두사 튜닝매개변수 효율적인 미세 조정사람의 피드백을 통한 인스트럭션 튜닝 및 강화 학습파인 튜닝과 프롬프트 엔지니어링 중 선택하기전문가 혼합리소스가 제한된 디바이스를 위한 모델 최적화효과적인 LLM 개발을 위한 교훈스케일링 법칙친칠라 모델학습 속도 최적화추측 샘플링결론참조
6. API 우선 LLM 배포
모델 배포하기1단계: 환경 설정2단계: LLM 컨테이너화하기3단계: Jenkins로 파이프라인 자동화하기4단계: 워크플로 오케스트레이션5단계: 모니터링 설정LLM용 API 개발하기API 주도 아키텍처 전략REST APIAPI 구현1단계: API의 엔드포인트 정의하기2단계: API 개발 프레임워크 선택3단계: API 테스트자격 증명 관리API 게이트웨이API 버전 관리 및 수명 주기 관리LLM 배포 아키텍처모듈형 및 모놀리식 아키텍처마이크로서비스 기반 아키텍처 구현하기리트리버 리랭커 파이프라인으로 RAG 자동화하기지식 그래프 업데이트 자동화배포 지연 시간 최적화여러 모델 오케스트레이션RAG 파이프라인 최적화하기비동기 쿼리조밀 검색과 희소 검색 방법 결합하기캐시 임베딩키-값 캐싱확장성 및 재사용성결론
7. LLM 평가 7.
평가가 어려운 문제인 이유성능 평가모든 것을 망치기 전에 무엇이 망가지는지 평가하기RAG 애플리케이션을 위한 메트릭에이전트 시스템을 위한 메트릭일반적인 평가 고려 사항자동화된 메트릭의 가치모델 드리프트기존 메트릭만으로는 충분하지 않음통합 가시성 파이프라인전처리 및 신속한 구성RAG 파이프라인에서의 검색LLM 추론포스트 프로세싱 및 출력 유효성 검사피드백 캡처결론참고 자료
8. 거버넌스 모니터링, 개인정보 보호 및 보안
데이터 문제 규모 및 민감도보안 위험프롬프트 인젝션탈옥기타 보안 위험방어 조치 LLMSecOpsLLMSecOps 감사 수행하기1단계: 범위 및 목표 정의하기2단계: 정보 수집3단계: 위험 분석 및 위협 모델링 수행4단계: 보안 제어 및 규정 준수 평가5단계: 모의 침투 테스트 및/또는 레드팀 수행6단계: 학습 데이터 검토7단계: 모델 성능 및 편향성 평가8단계: 감사 결과 및 권장 사항 문서화9단계: 지속적인 모니터링 및 검토 계획 세우기10단계 커뮤니케이션 및 수정 계획 수립안전 및 윤리적 가드레일결론참조
9. 확장: 하드웨어, 인프라 및 리소스 관리
올바른 접근 방식 선택확장 및 리소스 할당모니터링LLM을 위한 A/B 테스트 및 섀도 테스트자동 인프라 프로비저닝 및 관리Cloud 아키텍처의 프로비저닝 및 관리소유 하드웨어의 프로비저닝 및 관리자동 인프라 관리를 위한 모범 사례스케일링 법칙과 컴퓨팅 최적 논증LLM 인프라 최적화커널 퓨전정밀 스케일링하드웨어 활용LLM을 위한 병렬 및 분산 컴퓨팅데이터 병렬 처리모델 병렬 처리파이프라인 병렬 처리고급 프레임워크 ZeRO 및 DeepSpeedLLM 애플리케이션을 위한 백업 및 페일세이프 프로세스백업 전략의 유형가장 중요한 관행 정기적인 테스트 복원결론참고 자료

10. LLM 및 LLMOps의 미래
현재의 한계를 뛰어넘는 확장하이브리드 아키텍처: 신경망과 심볼릭 AI의 병합스파스 및 전문가 혼합 모델메모리 증강 모델: 지속적이고 컨텍스트가 풍부한 AI를 향하여해석 가능한 자가 최적화 모델모델 간 협업, 메타러닝, 멀티모달 미세 조정RAGLLM의 미래GPU 기술의 발전데이터 관리 및 효율성개인 정보 보호 및 보안포괄적인 평가 프레임워크LLMOps 엔지니어로서 성공하는 방법결론참고 자료추가 자료
색인
저자 소개

Content preview from LLMOps

7장. LLM을 위한 평가

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

언어 모델은 점점 더 정교해지고 있지만, 그 효과를 정확하게 평가하는 것은 여전히 중요한 과제로 남아 있습니다.

LLM 평가의 중요성은 학계뿐만 아니라 업계 이해관계자들로부터도 주목을 받고 있습니다. 이러한 연구와 테스트 노력의 융합은 문제의 중요성과 효과적인 해결책을 찾기 위한 공동의 결의를 의미합니다. 또한 혁신의 속도를 가속화하여 연구자들이 이러한 모델을 더욱 이해하고 개선하는 데 도움이 됩니다.

학계에서는 연구자들이 새로운 방법론을 탐구하고, 혁신적인 지표를 개발하고, 엄격한 실험을 통해 LLM 평가의 경계를 넓히기 위해 노력하고 있습니다. 몇몇 주요 경쟁자가 있지만, 많은 지표와 스코어보드가 단기간 또는 좁은 범위의 애플리케이션에만 유용하기 때문에 아직 명확한 승자는 없습니다. 그럼에도 불구하고 업계 관계자들은 LLM 성과가 갖는 실질적인 의미를 예리하게 인식하고 있습니다.

평가의 핵심은 일관되고 맥락에 맞는 텍스트를 생성하거나, 사용자 입력을 이해하거나, 특정 작업을 완료하는 등 LLM이 의도한 목적을 얼마나 잘 달성하는지를 측정하는 것입니다. 이 장에서는 다양한 애플리케이션에서 이 문제를 해결하기 위해 고안된 체계적인 프레임워크에 대해 알아보고 효과적인 방법에 대한 몇 가지 팁을 소개합니다.

평가가 어려운 문제인 이유

LLM평가 ( )는 성능과 역량을 평가하는 프로세스입니다. 여기에는 LLM이 의도한 목적을 얼마나 잘 달성하고 윤리적 지침을 준수하는지 판단하기 위한 여러 가지 방법이 포함됩니다.

머신러닝 솔루션을 개발하고 배포하려면 기존 소프트웨어 개발에서 사용되는 것과는 다른 새로운 유형의 테스트 및 평가를 만들어야 합니다. 특히 ML 모델은 학습 중에 난수를 사용하며, 학습이 올바르게 작동했는지 검증하는 데 도움이 될 수 있는 특정 원자 데이터뿐만 아니라 데이터 세트 전체에 대해 종합적으로 테스트해야 합니다. 그러나 일단 모델이 학습되면 대부분의 ML 모델은 추론에 무작위 방법을 사용하지 않는다는 점에서 결정론적(즉, 동일한 입력이 항상 동일한 출력을 생성한다는 점에서 결정론적)입니다.

반면, LLM은 학습 및 추론 과정에서 난수를 사용하므로 모델에 변화가 없더라도 동일한 입력이 다른 출력을 생성할 수 있습니다. 다른 몇 가지 가정은 더 이상 유효하지 않거나 보강할 필요가 없습니다. 이 장에서는 데이터 세트, 메트릭 및 방법론 선택과 관련된 몇 가지 미해결 질문에 대해 살펴봅니다.

운영 중인 모든 ML 솔루션은 프로덕션에 들어가기 전에 몇 가지 예상 성능 특성을 제공해야 합니다. 또한 배포 후 성능 문제를 식별하고 해결하기 위해 이를 효과적으로 모니터링할 수 있는 방법이 필요합니다. 모델 평가가 도움이 됩니다:

모델이 예상대로 작동하는지 확인합니다.
모델을 개선할 수 있는 영역 식별
모델이 안전하고 책임감 있게 사용되고 있는지 확인합니다.

LLM ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341663824

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

LLMOps

by Abi Aryan

7장. LLM을 위한 평가

평가가 어려운 문제인 이유

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.