Skip to Content
AIシステム性能エンジニアリング (Japanese Edition)
book

AIシステム性能エンジニアリング (Japanese Edition)

by Chris Fregly
November 2025
Intermediate to advanced
1060 pages
18h 47m
Japanese
O'Reilly Media, Inc.
Content preview from AIシステム性能エンジニアリング (Japanese Edition)

付録。AI システム性能チェックリスト(175項目以上)

この包括的なチェックリストは、AIシステム性能エンジニア向けに、広範なプロセスレベルのベストプラクティスと詳細な低レベル調整のアドバイスを網羅している。各項目は、AIシステムから最大限の性能と効率性を引き出すための実践的な指針となる。

AIシステムのデバッグ、プロファイリング、分析、チューニング時に本ガイドを活用せよ。低レベルのOSやCUDAの微調整からクラスタリング規模の最適化に至るまで、これらのヒントを体系的に適用することで、AIシステム性能エンジニアはCUDA、PyTorch、OpenAIのTriton、TensorFlow、Keras、JAXなど、多くのAIソフトウェアフレームワークを用いた最新のNVIDIA GPUハードウェア上で、超高速な実行とコスト効率の良い運用を同時に達成できる。このチェックリストの原則は、NVIDIAのGPU、ARMベースのCPU、CPU-GPUスーパーチップ、ネットワーク機器、ラックシステムなど、将来の世代のNVIDIAハードウェアにも適用される。

パフォーマンスチューニングとコスト最適化の考え方

実践的で文書化されたループ——深掘り作業の前に で即効性のある成果を追求する——が、エンジニアリング時間を測定可能なROIに変える。最大のランタイム要因とコスト要因をターゲットに設定し、常にプロファイリングで前後を比較して影響を検証することから始める。

自動チューニング、フレームワークのアップグレード、クラウド価格設定の調整、利用状況ダッシュボードを組み合わせて高ROIの成果を上げ、結果を文書化し、シンプルで維持可能な修正を優先する。精度が許容する範囲でスループットに敏感なハイパーパラメータを調整する。以下に、パフォーマンスチューニングとコスト最適化の考え方に関するヒントを示す:

コストのかかる部分を最初に最適化せよ

80/20の規則を活用する。実行時間に最も影響する要素を特定し、そこに集中する。実行時間の90%が数個のカーネルやコミュニケーションに集中している場合、1%しか占めない部分を細かく最適化するより、それらを徹底的に最適化する方が効果的だ。各章のテクニックは、最も効果的な箇所で適用すべきだ。例えば、トレーニングの40%がデータのロード、50%がGPU演算、10%がコミュニケーションだとすれば、まずデータのロードを修正する。オーバーヘッドを半分にできる可能性があるからだ。次にGPUカーネル最適化を検討する。

プロファイリングは前後で実施せよ

最適化を適用する時は、その影響を必ず測定せよ。当たり前のように聞こえるが、理論に基づいて微調整を行い、実際には効果がないどころか逆効果になるケースが少なくない。メモリ制限のないワークロードで、トレーニングジョブに活性化チェックポイント機能を有効化しようとした場合を考えてみよう。メモリ削減のために余分な演算リソースを使うことで、実際にはジョブが遅くなる可能性がある。つまり、変更前後のスループット、遅延、利用率といった主要メトリックを常に比較すべきだ。100回の反復における平均反復時間など、単純なプロファイリングには組み込みプロファイラを活用する。

適応型自動チューニングのフィードバックループを活用せよ

強化学習やベイズ最適化といった手法を用いて、リアルタイムのパフォーマンスフィードバックを活用する高度な自動チューニングフレームワークを実装し、システムパラメータを動的に調整する。このアプローチにより、システムは変化するワークロードや動作条件に対してレスポンスを伴って設定を継続的にファインチューニングできるようになる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

注目すべきレーダーのトレンド2026年1月 (Japanese Edition)

注目すべきレーダーのトレンド2026年1月 (Japanese Edition)

Mike Loukides

Publisher Resources

ISBN: 0642572281526