第2章. コンテンツのスタイルを制御する
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
この章( )のパターンはすべて、基盤モデルによって生成されるコンテンツ(テキスト、画像、動画など)のスタイルを制御することに関係している。基盤モデルとは、大規模データセットでトレーニングされたモデルであり、多種多様なコンテンツを生成することができる。しかし、そのコンテンツのスタイルは、デフォルトでは、モデルプロバイダーが使用したトレーニングプロセスに基づいている。単一のモデルのバージョンにこだわったとしても、モデルのレスポンスは確率的である。つまり、質問を正確に繰り返したとしても、異なるレスポンスが返ってくる可能性がある(キャッシュが行われていないと仮定して)。このことは、GenAIモデルからのレスポンスを使用するダウンストリームアプリケーションやエンドユーザは、かなり多種多様なスタイルに対応しなければならないことを意味する。
例えば、いくつかの基盤モデルに同じ質問をした:
ピエロギに合うおかずは?一文で答えよ。
そして、その回答を記録した(表2-1参照)。ご覧のように、答えを一文に限定しても、モデルによって同じ質問に対する答えが大きく異なることがわかる。もし、レスポンスのスタイルを一切制限していなかったら、どれほど多様な結果が得られたか想像してみてほしい!
| モデル | モデルプロバイダー | 回答 |
|---|---|---|
| GPT-4 | OpenAI | ピロシキには、バターでソテーした玉ねぎとカリカリに焼いたベーコンをかけると最高だ。 |
| クロード・ソネット3.5 | アンソロピック | ピリッとしたザワークラウトやキャラメリゼした玉ねぎは、餃子に対照的な酸味や甘みを加えることで、ピエロギを完璧に引き立てる。 |
| ジェミニ 2.0 フラッシュ | 玉ねぎとマッシュルームのソテーは、ピエロギのサイドディッシュとして定番のおいしさだ。 | |
| ラマ 3.2 70B | メタ | ピエロギの伝統的でおいしいサイドディッシュは、炒めた玉ねぎとサワークリームだが、他にも、ほうれん草のソテー、赤キャベツの煮込み、軽いヴィネグレットをかけたシンプルなグリーンサラダなども人気がある。 |
| ディープシーク-R1 | ディープシーク | ピリ辛のザワークラウトサラダや、ディル風味のロースト人参のキャラメリゼは、ピロシキの風味豊かなサイドメニューにぴったりだ。 |
| ミストラル・スモール24B | ミストラルAI | ピエロギの定番サイドディッシュはコールスローで、特にニンニクとハーブを加えるとよい。 |
どのようにしてレスポンスのスタイルをコントロール(制限)できるのか?自然さ、答えはあなたの目標に依存する-トーン、語彙、読み取りレベル、または形式を制御したいのか?プロンプトエンジニアリングを使うことで、これらのスタイルの側面をコントロールしようとすることはできるが、このようなアプローチは非常にもろい。この章のパターンは、スタイルを制御するという問題に対して、より洗練された堅牢性のある解決策をバリエーション豊富に提供しているので、自分のニーズに最も適したものを選ぶか、パターンを組み合わせることができる。
ロジットマスキング(パターン1)は、生成されたテキストが一連の規則に従うことを保証する。文法(パターン2)は、生成されたテキストがユーザ指定のスキーマまたは標準データ形式に準拠することを保証する-これはロジツマスキングに似ているが、モデルプロバイダーによってサーバ側で実行される。スタイル転送(パターン3)は、テキストや生成された画像が参照コンテンツの望ましい特徴を持つことを保証するために、翻訳例を使用する。逆中和(パターン4)は、参照コンテンツしか利用できない場合にスタイル転送を実行する方法を提供する。最後に、コンテンツ最適化(パターン5)は、そのスタイルの要因が何であるかを特定することなく、最適なスタイルを選択する方法である。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access