Skip to Content
生成AIの可視化
book

生成AIの可視化

by Priyanka Vergadia, Valliappa Lakshmanan
November 2025
Beginner to intermediate
322 pages
5h 15m
Japanese
O'Reilly Media, Inc.
Content preview from 生成AIの可視化

第5章 汎用AIアプリケーションのアーキテクト

第5章

生成AIアプリケーションのアーキテクト設計

第4章ではエージェント型システムの構築方法について論じたが、各エージェントがLLM呼び出しを伴うことを前提としていた。毎回LLMを呼び出すエージェントに依存するアーキテクチャは、設計不足のアプリケーションを生み出し、コストが高すぎ、速度が遅すぎる結果となる。本章では(図5-1参照)、特定のユースケースにおいて、設計の複雑さ、コスト、遅延、LLM使用のリスクをどうバランスさせるかを検討する

図5-1. この章の構成

基盤モデルの選択

GenAIアプリケーションを構築する際、最初に直面する選択の一つが基盤モデルとしてどのLLMを採用するかだ。図5-2 はこの選択のための決定木を示している

図5-2.執筆時点での基盤LLMの選択。本書を読み取る時点でも同様のプロセスを用いるが、相対的なスコアやモデルバージョンは異なる可能性がある。

LangChainのようなフレームワークを使えばLLMに依存しない設計も可能だが、現実はそれほど単純ではない(図5-3)。コード自体は動作するが、LLMsを変更すると結果が一致しなくなる。アプリケーションパイプラインの 各ステップを構築する際プロンプトや解析コードを変更せざるを得ないからだ(第2章で推奨するシグネチャやPydantic構造を採用した場合でも同様である)

図5-3.LLMに依存しない状態()は可能だが、容易ではない。

コードは通常、概念実証(PoC)段階で各ステップを実験しながら段階的に開発される。こうした段階的に開発されたアプリケーションは、基盤となるLLMを変更すると動作しない場合が多い。このため、本番環境で使用する予定のモデルプロバイダーで実験を行うのが最善である

モデル間の直接比較

モデルプロバイダーはしばしばメトリックやベンチマークデータセットを操作するため、異なるモデルの品質を比較する最良の方法の一つは、人間に2つのLLMsからのレスポンスを提示し、より優れた方を選ばせるブラインド調査である。研究組織 Large Model Systems(LMSYS)(https://chat.lmsys.org)はこの手法を大規模かつ公開・透明性をもって実施し、各対比比較の入力プロンプト、出力レスポンス、人間の選好を公表している。

執筆時点(2024年7月)で、LMSYSは100万件以上の対照比較を実施している。全てのデータポイントが公開されているため、比較結果をスライスして分析できる。例えば特定のトピックや特定の長さのプロンプトでフィルタリングすることも可能だ。LMSYSのリーダーボードは、これらの人間による比較をチェス大会の一致のように扱い、各モデルに対して「アリーナスコア」(チェスプレイヤーのランク付けに用いられるEloスコアに大まかに類似)を算出する。主要なモデルプロバイダーは全てLMSYSでモデルを公開しており、リーダーボードは ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

大規模データ管理 ―エンタープライズアーキテクチャのベストプラクティス

大規模データ管理 ―エンタープライズアーキテクチャのベストプラクティス

Piethein Strengholt, 村上 列
ソフトウェア工学の基礎

ソフトウェア工学の基礎

Nathaniel Schutta, Dan Vega

Publisher Resources

ISBN: 0642572277390