February 2008
Intermediate to advanced
400 pages
10h
German
Die Kreuzvalidierung ist der Name einer Reihe von Techniken, die Daten in Trainings- und Testsets aufteilen. Das Trainingsset wird dem Algorithmus zusammen mit den korrekten Antworten übergeben (in diesem Fall den Preisen) und genutzt, um damit Voraussagen zu treffen. Der Algorithmus wird dann verwendet, um Vorhersagen für jedes Element im Testset zu erstellen. Die gelieferten Antworten werden mit den korrekten Antworten verglichen, und eine Gesamtbewertung für die Qualität des Algorithmus wird berechnet.
Normalerweise wird diese Prozedur viele Male durchgeführt, wobei die Daten jedes Mal anders unterteilt werden. Typischerweise ist das Testset nur klein, vielleicht 5 % der Daten, während die restlichen 95% das Trainingsset bilden. ...