はじめに
これまで「LLM/AIエンジニアとLLMOpsエンジニアの違いを教えてほしい」という質問を、会議やカンファレンス、この分野の方とコーヒーを飲むときなど、さまざまな場面で何度も受けてきました。これはよく話題に上る典型的な質問です。
以前は、それぞれの役割の技術的な違いから説明し始めていました。しかし時間がたつにつれて、本当の問題は別にあると気付きました。多くの人が、大規模言語モデル(LLM)を長期間にわたって本番環境で動かし続けるために何が必要かを十分に理解していないのです。
2025年初頭の今、最先端のモデルや手法、ベストプラクティスは数日ごとに入れ替わっていますが、その複雑さを理解している人はごくわずかです。多くの人はいまも「operationalizing」、つまり「Ops」をデプロイと同義に捉えています。しかし、LLMのコンテキストでは、人とプロセスとテクノロジーを効率的に連携させ、これらのモデルを本番環境で安全で、堅牢かつ信頼できる状態に整えることがOpsなのです。
企業と人事部門は、自分たちのチームやプロジェクトにとって何を意味するのかを必死に見極めようとしています。本書では、その疑問に答えるためにできる限りのことをしました。本書は、これらの役割を定義する書籍でもなければ、LLMを構築してデプロイする方法の手引きでもありません。確かにそれらの話題にも触れますが、もはやそれだけで十分な時代ではありません。LLMベースのアプリケーションが本番稼働に入ったら、誰かが継続的に最適化し続けなければなりません。それを怠ると、単純な問題に複雑すぎるソリューションを適用してしまったり、利用数の増加による高負荷やプロンプトインジェクション攻撃でシステムが不安定になるなど、脆弱なシステムができあがってしまいます。それは手入れが行き届いていない、まるで砂上の楼閣のようなシステムです。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access