
1
「今日の天気は」 「晴れ」
「今日の天気は晴れ」 「です」
「今日の天気は晴れです」 「 。」
図1.1.2
1.1.4
大規模言語モデル
大規模言語モデル(LLM:Large Language Model)は、名前の通り大規模な言語モデルの
ことです。では何が大規模なのでしょうか。それは、モデルのパラメータの数です。明確な定
義があるわけではありませんが、大規模言語モデルの礎となっているGPT-3 のパラメータ数
が175 億個であることから、だいたい100 億個以上のパラメータを持つ言語モデルから大規模
言語モデルと呼ばれます。パラメータが増えると学習に要する時間や学習データ量も同様に大
きくなります。したがって、大規模言語モデルはパラメータ数、学習時間、学習データがとて
も大きな言語モデルということになります。
大規模言語モデルが大規模でない言語モデルと大きく異なる点は、その創発的能力
(Emergent Abilities)[Wei, Tay, et al. 2022]の有無です。創発的能力は、言語モデルの規模が
一定を超えると突然獲得される様々な能力のことです。これらの能力は、言語モデルに対して
プロンプトで指示を行うことで、活用することができます。
創発的能力は、明示的に訓練されたものではないという点が従来の機械学習で獲得された能
力と異なります。大規模言語モデルの出現以前は、計算やデータ分類、自然言語処理の基本的 ...