Skip to Content
AIシステム性能エンジニアリング (Japanese Edition)
book

AIシステム性能エンジニアリング (Japanese Edition)

by Chris Fregly
November 2025
Intermediate to advanced
1060 pages
18h 47m
Japanese
O'Reilly Media, Inc.
Content preview from AIシステム性能エンジニアリング (Japanese Edition)

第2章 AI システムハードウェアの概要

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

スーパーコンピュータ級のAIハードウェアを単一のラックに凝縮すると想像してみろ。NVIDIAの最新アーキテクチャはまさにそれを実現した。この章では、がCPUとGPUを強力なスーパーチップに融合し、さらにそれらを数十個超高速インターコネクトで接続してAIスーパーコンピュータを箱に作成した仕組みを掘り下げる。基本的なハードウェア構成要素であるGrace CPUとBlackwell GPUを探求し、それらの緊密な統合と巨大なメモリプールがAIエンジニアの作業をいかに容易にするかを検証する。

次に、72個のGPUを単一のマシンのように連結するネットワークファブリックへと視野を広げる。その過程で、このシステムに超能力をもたらす演算性能、メモリ容量、効率性における飛躍的な進歩を強調する。最終的には、この最先端ハードウェアが、これまで不可能と思われていた数兆パラメータ規模のモデルのトレーニングとサービングをいかに可能にするかを理解できるだろう。

CPUとGPUのスーパーチップ

NVIDIAの AIスケーリング戦略は、単一の統合型CPU+GPUスーパーチップモジュールから始まる。Hopper世代以降、NVIDIAはARMベースのCPUと1つ以上のGPUを同一ユニットにパッケージ化し、高速インタフェースで緊密に連携させた。その結果、単一のモジュールが統合コンピューティングエンジンとして動作するようになった。

スーパーチップ の最初の実装はGrace Hopper(GH200)であり、1つのGrace CPUと1つのHopper GPUを組み合わせた。次に登場したのがGrace Blackwell(GB200)スーパーチップで、1つのGrace CPUと2つのBlackwell GPUを同一パッケージに収めた。Grace CPUはモジュール中央に位置し、図2-1に示すように2つのBlackwell GPUダイに囲まれている。

NVIDIA Grace Blackwell Superchip module featuring a central Grace CPU and two Blackwell GPUs, designed for integrated high-speed communication and shared memory.
図 2-1. NVIDIA Grace Blackwell スーパーチップモジュール。1 つの Grace CPU(中央)と 2 つの Blackwell B200 GPU(左上と右上)を単一モジュール上に搭載。共有の統合メモリ空間を持ち、NVLink-C2C(チップ間)と呼ばれるカスタムスピードリンクで接続されている。

従来のシステムでは、CPUとGPUは別々のメモリプールを持ち、比較的低速なバス(PCIeなど)を介してコミュニケーションするため、データの往復コピーが必要となる。 NVIDIAのスーパーチップは、CPUとGPUをNVLink-C2C(チップ間接続)と呼ばれるカスタム高速リンクで接続することで、この障壁を解消している。

NVLink-C2Cは、GB200スーパーチップ内のGrace CPUとBlackwell GPU間で最大約900GB/sの転送速度を提供する。比較すると、PCIe Gen5 x16(Blackwell B200)は片方向あたり約64GB/s、PCIe Gen6 x16(Blackwell Ultra B300)は片方向あたり約128GB/sである。NVLink-C2Cの相互接続スピードは、一般的なPCIeよりも順序が桁違いに速い。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

注目すべきレーダーのトレンド2026年1月 (Japanese Edition)

注目すべきレーダーのトレンド2026年1月 (Japanese Edition)

Mike Loukides

Publisher Resources

ISBN: 0642572281526