Kapitel 9. Verstärkungslernen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wie ein Mensch lernen unsere Agenten für sich selbst, um erfolgreiche Strategien zu erreichen, die zu den größten langfristigen Belohnungen führen. Dieses Paradigma des Lernens durch Versuch und Irrtum, allein durch Belohnungen oder Bestrafungen, ist als Verstärkungslernen bekannt.1

DeepMind (2016)

Die in den Kapiteln 7 und 8 angewandten Lernalgorithmen fallen in die Kategorie des überwachten Lernens. Diese Methoden setzen voraus, dass ein Datensatz mit Merkmalen und Bezeichnungen vorhanden ist, der es den Algorithmen ermöglicht, Beziehungen zwischen den Merkmalen und Bezeichnungen zu lernen, um bei Schätz- oder Klassifizierungsaufgaben erfolgreich zu sein. Wie das einfache Beispiel in Kapitel 1 zeigt, funktioniert das Reinforcement Learning (RL) anders. Zunächst einmal muss kein umfassender Datensatz mit Merkmalen und Bezeichnungen im Voraus gegeben werden. Die Daten werden vielmehr vom Lernagenten generiert, während er mit der Umgebung interagiert, die ihn interessiert. Dieses Kapitel befasst sich ausführlich mit RL und stellt die grundlegenden Begriffe sowie einen der beliebtesten Algorithmen in diesem Bereich vor: Q-learning (QL). Neuronale Netze werden durch RL-Algorithmen nicht ersetzt; sie spielen auch in diesem Zusammenhang eine wichtige Rolle.

In "Fundamental Notions" werden die grundlegenden Begriffe des ...

Get Künstliche Intelligenz im Finanzwesen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.