第9章 ジェネレーティブAIアプリケーションのためのAzure OpenAIサービスの活用 ジェネレーティブAIアプリケーションのためのAzure OpenAIサービスの活用
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
ジェネレーティブAI は単なるゲームチェンジャーではなく、すべての人にカンニングペーパーを渡している。小さなパン屋がAzure OpenAIを使って、パーソナライズされたウエディングケーキの説明を数秒で作成したり、地方の病院が働き過ぎの看護師でも信頼できる患者の退院サマリーを自動生成したりする様子を思い浮かべてほしい。それがAzure OpenAIのようなサービスの本当の魅力だ。機械学習の博士号を持っていなくても、「いつか」のアイデアを今日のワークフローに変えることができる。GPUクラスターをねだったり、トレーニングデータをかき集めたりする必要はもうない。これらのモデルをツールボックスに入れれば、昼食までにカスタマーサービスボットをプロトタイピングし、夕食までにそれを改良する準備ができる。
この章は、その革命へのバックステージパスである。なぜよく練られたプロンプトが一般的なインストラクションよりも優れているのか、なぜAI-102のジェネレーティブAIセクションに合格することがAPIを覚えることではないのか。役員室でもコードレビューでも通用する青写真を手にすることができる。
Microsoft Azure上のジェネレーティブAI
Microsoft Azureでは、ジェネレーティブAIは主にAzure OpenAI Serviceによって駆動され、OpenAIの基盤モデルをAzureに接続し、ワークロードで使用できるようにする。このセクションでは、このやり取りがどのように機能するのかを探る。
生成AIモデルの種類
Azure OpenAI Service は、それぞれ異なるタイプのタスクに適した、バリエーション豊かな生成AIモデルを提供している。表9-1は、利用可能なモデルの概要を、その能力(強みと弱み)とユースケースに分けて示しており、ニーズに最適なモデルを選択するのに役立つ。
| モデル | 強み | 限界 | 典型的なアプリケーション | コスト | 遅延とスループット |
|---|---|---|---|---|---|
| GPT-4 | 高度な推論、マルチモダリティ入力、堅牢性コードサポート | 最高コスト層、小規模モデルよりスループットが低い | 洗練度チャットボット、詳細なドキュメント生成、コード支援 | プロンプトトークン1Mあたり30ドル、完了トークン1Mあたり60ドル | 遅延は中程度(トークン1Kあたり数十~数百ミリ秒)で、1分あたり5万トランザクションの割り当て(TPM)がある |
| GPT-3.5 | 費用対効果、高スループット、チャット用に最適化されている | ニュアンスに乏しい推論、コンテキストウィンドウが小さい | カスタマーサポートボット、テキスト補完、個別指導 | プロンプトトークン1Mあたり1.50ドル、完了トークン1Mあたり2.00ドル | 遅延が少なく(1Kトークンあたり数十ミリ秒)、200K TPMの割り当てがある |
| 埋め込み | 深い意味理解、低コスト | テキスト生成なし、対話には向かない | 意味検索、推薦、クラスタリング | 1Mトークンあたり0.40ドル(1kあたり0.0004ドルの場合) | 非常に高速(通常、呼び出しあたり50ミリ秒以下) ... |
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access