Skip to Content
Kubernetes上での生成AI (Japanese Edition)
book

Kubernetes上での生成AI (Japanese Edition)

by Roland Huß, Daniele Zonca
February 2026
Intermediate to advanced
406 pages
6h 41m
Japanese
O'Reilly Media, Inc.
Content preview from Kubernetes上での生成AI (Japanese Edition)

第2章 モデルデータ

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

Kubernetes上でLLMsを実行する際の最も根本的な課題の一つは、モデルデータの膨大なサイズを管理することだ。LLMsのサイズは数ギガバイトからほぼ1テラバイトに及ぶこともあり、このデータをランタイムがアクセス可能なKubernetesクラスタに効率的に取り込むには慎重な検討が必要となる。

これらのモデルの大部分はモデルパラメータで構成されており、非常に巨大な規模になることがある。 表2-1には、実際に実行可能な主要なモデルのパラメータ数とサイズをリストした。 他にも多数存在するが、この選択だけでも幅広いバリエーションが確認できる。 オンデマンド利用には非現実的な大規模モデルから、自身のクラスターで実行可能で必要時に容易にダウンロードできる軽量モデルまで様々だ。

表 2-1. オープンソースモデルとその サイズ
名前 ベンダ パラメータ サイズ

Llama 4 Maverick

Meta

4000億(MoE、170億がアクティブ)

約800GB

DeepSeek-V3

DeepSeek

6710億(MoE、370億アクティブ)

約700GB

Llama 3.1405B

Meta

4050億

約750ギガバイト

Qwen3-235B

アリババ

2350億(MoE、220億アクティブ)

約118ギガバイト

ミストラル 8x220億

ミストラル

1410億(MoE、390億アクティブ)

約88GB

GPT-OSS 120B

OpenAI

1170億(MoE、50億アクティブ)

約70GB

Gemma 2 270億

Google

270億

約54ギガバイト

グラニット 130億

IBM

130億

約26ギガバイト

ファルコン 211B

TII

110億

約22ギガバイト

ミストラル 7B

ミストラル

70億

約14GB

さらに小規模なモデルであっても、クラスター内で効率的に管理する際にはKubernetes管理者にとって重大な課題となる。 これらの大規模データセットを効果的に保存・整理する方法を理解することは、LLM運用を成功させる上で極めて重要だ。

本章では、Kubernetesクラスタ内でデータ集約型成果物を効率的に管理する方法を探る。 多くの場合、機械学習モデルは第1章で説明した推論サービスからアクセスされる不透明な箱として扱える。 しかし、これらのモデルを配布するパッケージ形式を理解することは、統合を成功させる上で依然として価値がある。 次のセクションでは、最も重要なLLMストレージ形式の概要を説明する。

LLMs運用におけるもう一つの重要な側面は、モデルデータの所在を発見し検索する方法である。 「モデルレジストリ」で論じるモデルレジストリの概念は、モデル発見とアクセスに対する実用的な解決策を提供する。

最後に、モデルはクラスターにダウンロードされて初めて使用可能になる。 「Kubernetes におけるモデルデータへのアクセス」では、モデルデータを効率的に取得・アクセスするための Kubernetes ネイティブメソッドを概説する。

このロードマップを念頭に、まずLLMデータがどのようにパッケージ化され保存されるかを検証しよう。

モデルデータ保存形式

のLLMを扱う際にまず気付くのは、その膨大なサイズだ。パラメータ数は数十億単位で測定される。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

ドメイン駆動型トランスフォーマー変換 (Japanese Edition)

ドメイン駆動型トランスフォーマー変換 (Japanese Edition)

Carola Lilienthal, Henning Schwentner

Publisher Resources

ISBN: 0642572344641