
本書は大規模言語モデル(LLM:Large Language Model)を用いたソフトウェアを開発す
るための知識と技術を体系的にまとめた1冊です。単にLLMをブラックボックスとして使え
るようにするだけでなく、内部的な仕組みを理解し、より効果的に使えるようにすることが本
書の狙いです。
人類の歴史において、ごく最近までは地球上で言葉を操る知的な存在は人間のみと考えられ
てきました。しかし、2022 年のChatGPT の登場を皮切りに、言葉を操るAIが急速に普及し
ました。人類と同等またはそれ以上の知性を持った存在が現実のものとなりつつあります。こ
の変化は、人類の歴史における最も大きな技術的ブレークスルーと言えるかもしれません。そ
して、この進化の中心にあるのがLLM です。
LLMがこれまでの AI技術と一線を画すのはその汎用性です。従来の機械学習モデルは特定
のタスクに特化していましたが、LLM は大量のテキストデータから学習することで、直接教
えられていないタスクにも対応できる創発的能力(Emergent Abilities)[ Wei, Tay, et al.
2022]を有します。すなわち、自然言語による指示(プロンプト)を介して、幅広いタスクを
こなすことが可能です。例えば、コード生成、翻訳、要約、質問応答、情報抽出・分析、さら
には創造的な文章の作成など、多岐にわたる分野に応用できます。また、現実のシステムや外
部環境と連携して行動するAI エージェントの頭脳として LLMを活用することで、エージェン ...