Kapitel 12. Modellauswahl

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

12.0 Einleitung

Beim maschinellen Lernen verwenden wir Trainingsalgorithmen, um die Parameter eines Modells zu lernen, indem wir eine Verlustfunktion minimieren. Viele Lernalgorithmen (z. B. Support Vector Classifier und Random Forests) verfügen jedoch über zusätzliche Hyperparameter, die vom Benutzer festgelegt werden und beeinflussen, wie das Modell seine Parameter lernt. Wie wir bereits erwähnt haben, sind die Parameter (manchmal auch Modellgewichte genannt) das, was die Modelle während des Trainingsprozesses lernen, während die Hyperparameter manuell von uns (den Nutzern) festgelegt werden.

Zufällige Wälder sind zum Beispiel Sammlungen von Entscheidungsbäumen (daher das Wort Wald); die Anzahl der Entscheidungsbäume im Wald wird jedoch nicht vom Algorithmus gelernt und muss vor der Anpassung festgelegt werden. Dies wird oft als Hyperparameter-Tuning, Hyperparameter-Optimierung oder Modellauswahl bezeichnet. Außerdem kann es sinnvoll sein, mehrere Lernalgorithmen auszuprobieren (z. B. Support Vector Classifier und Random Forest, um herauszufinden, welche Lernmethode das beste Modell ergibt).

In diesem Buch bezeichnen wir die Auswahl des besten Lernalgorithmus und seiner besten Hyperparameter als Modellauswahl, auch wenn die Terminologie in diesem Bereich sehr unterschiedlich ist. Der Grund dafür ist einfach: Stell dir ...

Get Maschinelles Lernen mit Python Kochbuch, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.