
4
ことが期待できます。
temperatureを使ったトークンサンプリングの仕組みについては 1.5.1 を参照してください。
top-p(トップ p)
top-pは言語モデルが次のトークンを予測する際に使用するパラメータです。top-p を用いた
トークンのサンプリングでは、確率の累積値が閾値p 以上になるまでのトークンを選択の対象
とします。このため、top-pを小さく設定すると、生成されるテキストはより確定的で一貫性
のあるものになります。一方、top-pを大きく設定すると、生成されるテキストはより多様性
に富んだものになります。
top-pを使ったトークンサンプリングの仕組みについては 1.5.3 を参照してください。
最大トークン数
最大トークン数は、言語モデルが生成するテキストの最大長を制御するパラメータです。こ
のパラメータはトークンの数で指定され、生成されるテキストが指定された長さを超えないよ
うにします。
最大トークン数の主な目的は、無駄に長いトークン列の生成によって計算資源が消費される
ことを防ぐことです。最大トークン数の値は、言語モデルに与えられるプロンプトとは独立し
て機能します。つまり、プロンプトの内容に関わらず、最大トークン数で指定された長さを超
えるテキストは生成されません。
最大トークン数を使用する際には、文が途中で切れる可能性がある点に注意する必要があり
ます。このため、多くの場合、プロンプト中で長さを指定する方が自然なテキストの生成に適
しています。プロンプトでは、「100単語程度で要約してください」 ...