Kapitel 6. Agentenarchitektur
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Aufbauend auf den in Kapitel 5 beschriebenen Architekturen wird in diesem Kapitel die vielleicht wichtigste aller aktuellen LLM-Architekturen behandelt: die Agentenarchitektur. Zunächst stellen wir vor, was LLM-Agenten so einzigartig macht, dann zeigen wir, wie man sie baut und wie man sie für gängige Anwendungsfälle erweitert.
In dem Bereich der künstlichen Intelligenz gibt es eine lange Geschichte der Entwicklung von (intelligenten) Agenten, die am einfachsten mit den Worten von Stuart Russell und Peter Norvig in ihrem Lehrbuch Artificial Intelligence (Pearson, 2020) als "etwas, das handelt" definiert werden können. Das Wort " Agenten " hat jedoch mehr Bedeutung, als man auf den ersten Blick sieht:
-
Handeln erfordert eine gewisse Fähigkeit, zu entscheiden, was zu tun ist.
-
Wenn du eine Entscheidung treffen willst, musst du mehr als nur eine Handlungsoption haben. Denn eine Entscheidung ohne Optionen ist keine Entscheidung.
-
Um Entscheidungen treffen zu können, braucht der Agent auch Zugang zu Informationen über die externe Umgebung (alles, was außerhalb des Agenten selbst liegt).
Eine agenturische LLM-Anwendung muss also eine Anwendung sein, die ein LLM nutzt, um aus einer oder mehreren möglichen Handlungsoptionen auszuwählen, wenn ein Kontext über den aktuellen Zustand der Welt oder einen gewünschten nächsten ...