Kapitel 10. Deep Reinforcement Learning für Zeitreihenvorhersagen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Verstärkungslernen ist ein Zweig des maschinellen Lernens, der sich mit sequentiellen Entscheidungsproblemen beschäftigt. Algorithmen in diesem Bereich lernen, optimale Entscheidungen zu treffen, indem sie mit einer Umgebung interagieren und Feedback in Form von Belohnungen erhalten. Im Zusammenhang mit Zeitreihenprognosen können damit Modelle entwickelt werden, die auf der Grundlage historischer Daten sequenzielle Vorhersagen machen. Herkömmliche Prognoseverfahren stützen sich oft auf statistische Methoden oder überwachte Lerntechniken, die von der Unabhängigkeit der Datenpunkte ausgehen. Zeitreihendaten weisen jedoch zeitliche Abhängigkeiten und Muster auf, die mit Hilfe von Reinforcement Learning effektiv erfasst werden können.

Bei Reinforcement-Learning-Modellen für Zeitreihenprognosen handelt es sich in der Regel um einen Agenten, der auf der Grundlage von beobachteten Zuständen Aktionen ausführt und je nach Genauigkeit seiner Vorhersagen Belohnungen erhält. Der Agent lernt durch Versuch und Irrtum, um die kumulierten Belohnungen über die Zeit zu maximieren. Die zentrale Herausforderung besteht darin, ein optimales Gleichgewicht zwischen Exploration (dem Ausprobieren neuer Aktionen) und Exploitation (der Nutzung des gelernten Wissens) zu finden.

Dieses Kapitel gibt einen grundlegenden ...

Get Deep Learning für Finanzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.