Skip to Content
AI 시스템 성능 엔지니어링 (Korean Edition)
book

AI 시스템 성능 엔지니어링 (Korean Edition)

by Chris Fregly
November 2025
Beginner to intermediate
1060 pages
20h 15m
Korean
O'Reilly Media, Inc.
Content preview from AI 시스템 성능 엔지니어링 (Korean Edition)

부록. AI 시스템 성능 체크리스트 (175개 이상 항목)

이 포괄적인 체크리스트는 AI 시스템 성능 엔지니어를 위한 광범위한 프로세스 수준 모범 사례와 세부적인 저수준 튜닝 조언을 모두 다룹니다. 각 체크리스트 항목은 AI 시스템에서 최대 성능과 효율성을 끌어내기 위한 실질적인 지침 역할을 합니다.

AI 시스템 디버깅, 프로파일링, 분석 및 튜닝 시 이 가이드를 활용하십시오. 저수준 OS 및 CUDA 조정부터 클러스터 규모 최적화에 이르기까지 이러한 팁을 체계적으로 적용함으로써, AI 시스템 성능 엔지니어는 CUDA, PyTorch, OpenAI의 Triton, TensorFlow, Keras, JAX 등 다양한 AI 소프트웨어 프레임워크를 사용하여 최신 NVIDIA GPU 하드웨어에서 번개처럼 빠른 실행과 비용 효율적인 운영을 동시에 달성할 수 있습니다. 이 체크리스트의 원칙은 NVIDIA의 차세대 하드웨어(GPU, ARM 기반 CPU, CPU-GPU 슈퍼칩, 네트워킹 장비, 랙 시스템 포함)에도 적용됩니다.

성능 튜닝과 비용 최적화 마인드셋

실용적이고 문서화된 반복 과정—심층 작업 전 빠른 성과 —은 엔지니어링 시간을 측정 가능한 ROI로 전환합니다. 가장 큰 실행 시간 및 비용 요인을 목표로 삼고, 항상 자질을 통해 영향을 검증하세요.

자동 튜닝, 프레임워크 업그레이드, 클라우드 가격 조정 레버, 활용도 대시보드를 결합하여 높은 ROI 성과를 달성하고, 결과를 문서화하며 단순하고 유지 보수성 있는 수정 방안을 우선시하세요. 정확도가 허용할 경우 처리량에 민감한 하이퍼파라미터를 조정하세요. 성능 튜닝 및 비용 최적화 마인드셋에 대한 몇 가지 팁은 다음과 같습니다:

비용이 많이 드는 부분을 먼저 최적화하세요

80/20 법칙을 적용하십시오. 실행 시간에 가장 큰 영향을 미치는 요소를 찾아 집중하십시오. 실행 시간의 90%가 몇 개의 커널이나 통신 단계에 소요된다면, 1%의 시간을 차지하는 부분을 미세 최적화하기보다 해당 부분을 깊이 있게 최적화하는 것이 더 효과적입니다. 각 장의 기법은 가장 중요한 부분에 적용해야 합니다. 예를 들어, 훈련 과정이 데이터 로딩 40%, GPU 연산 50%, 통신 10%로 구성된다면, 먼저 데이터 로딩을 해결하세요. 오버헤드를 절반으로 줄일 수 있을 것입니다. 그다음 GPU 커널 최적화를 살펴보세요.

자질 전후 비교

최적화를 적용할 때마다 그 효과를 측정하세요. 당연한 말처럼 들리지만, 종종 이론에 기반한 조정이 실제로는 도움이 되지 않거나 오히려 해가 될 수 있습니다. 워크로드가 메모리 제한이 아닌 상황에서 훈련 작업에 활성화 체크포인트를 활성화하기로 결정했다고 가정해 보십시오. 이는 메모리를 줄이기 위해 추가 컴퓨팅을 사용함으로써 실제로 작업 속도를 늦출 수 있습니다. 즉, 변경 전후의 처리량, 지연 시간, 활용률과 같은 핵심 지표를 항상 비교해야 합니다. 100회 반복에 걸친 평균 반복 시간과 같은 간단한 타이밍 측정을 위해 내장 프로파일러를 사용하십시오.

적응형 자동 튜닝 피드백 루프를 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

PostgreSQL로 데이터 및 AI 플랫폼 구축하기 (Korean Edition)

PostgreSQL로 데이터 및 AI 플랫폼 구축하기 (Korean Edition)

Tom Taulli, Benjamin Anderson, Jozef de Vries
도메인 중심 혁신 (Korean Edition)

도메인 중심 혁신 (Korean Edition)

Carola Lilienthal, Henning Schwentner
AI 에이전트를 위한 메모리 관리

AI 에이전트를 위한 메모리 관리

Benjamin Labaschin, Jim Allen Wallace, Andrew Brookins, Manvinder Singh

Publisher Resources

ISBN: 0642572281533