Kapitel 4. Technisches Interview: Modellschulung und Bewertung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Kapitel befassen wir uns mit dem ML-Modelltrainingsprozess und den damit verbundenen Interviewfragen. Für viele Praktikerinnen und Praktiker ist das Modelltraining der aufregendste Teil, und ich stimme dem zu - es ist sehr befriedigend, zu sehen, wie das Modell im Laufe des Prozesses immer genauer wird. Um mit dem ML-Modelltraining, der Abstimmung der Hyperparameter und den Experimenten mit verschiedenen Algorithmen zu beginnen, brauchst du jedoch Daten. Beim maschinellen Lernen geht es im Kern darum, dass Algorithmen Muster in Daten finden und dann auf der Grundlage dieser Muster Vorhersagen und Entscheidungen treffen. Nützliche Daten sind die Grundlage des maschinellen Lernens, und wie das Sprichwort sagt: "Garbage in, garbage out". Das heißt, wenn die ML-Modelle auf unbrauchbaren Daten trainiert werden, dann sind auch das Modell und die daraus resultierenden Schlussfolgerungen unbrauchbar.
Ich beginne mit einem Überblick über die Datenverarbeitung und -bereinigung, bei der Rohdaten in ein Format umgewandelt werden, das für ML-Algorithmen nützlich (und mit ihnen kompatibel) ist. Danach gehe ich auf die Auswahl von Algorithmen ein, z. B. auf Kompromisse zwischen ML-Algorithmen in verschiedenen Szenarien und darauf, wie man generell den besten Algorithmus für ein bestimmtes ...