Kapitel 11. Messfehler
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In den vorangegangenen Kapiteln haben wir eine Vielzahl von Messgrößen verwendet, um Modelle zu vergleichen oder zu beurteilen, wie gut ein Modell seine Aufgabe erfüllt. In diesem Kapitel befassen wir uns mit bewährten Methoden zur Beurteilung der Vorhersagegenauigkeit, wobei der Schwerpunkt auf den Besonderheiten von Zeitreihendaten liegt.
Für diejenigen, die neu in der Zeitreihenprognose sind, ist es wichtig zu verstehen, dass eine Standard-Kreuzvalidierung in der Regel nicht ratsam ist. Du kannst die Trainings-, Validierungs- und Testdatensätze nicht auswählen, indem du zufällig ausgewählte Stichproben der Daten für jede dieser Kategorien auf eine zeitunabhängige Weise auswählst.
Aber es ist noch komplizierter als das. Du musst darüber nachdenken, wie verschiedene Datenproben zeitlich zueinander in Beziehung stehen, auch wenn sie unabhängig zu sein scheinen. Angenommen, du arbeitest an einer Aufgabe zur Klassifizierung von Zeitreihen und hast viele Stichproben aus verschiedenen Zeitreihen, von denen jede einen eigenen Datenpunkt darstellt. Es könnte verlockend sein, zu denken, dass du in diesem Fall zufällig Zeitreihen für Training, Validierung und Test auswählen kannst. Das Problem bei diesem Ansatz ist, dass er nicht die Art und Weise widerspiegelt, wie du dein Modell verwenden würdest, nämlich dass dein Modell auf früheren ...
Get Praktische Zeitreihenanalyse now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.