Kapitel 8. Feature Engineering mit Rezepten
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Beim Feature-Engineering werden die Prädikatorwerte neu formatiert, damit sie von einem Modell besser genutzt werden können. Dazu gehören Umformungen und Kodierungen der Daten, um ihre wichtigen Merkmale bestmöglich darzustellen. Stell dir vor, du hast zwei Prädiktoren in einem Datensatz, die in deinem Modell besser als Verhältnis dargestellt werden können. Ein einfaches Beispiel für Feature Engineering ist die Erstellung eines neuen Prädiktors aus dem Verhältnis der beiden ursprünglichen Werte.
Der Standort eines Hauses in Ames ist ein komplexeres Beispiel. Es gibt eine Vielzahl von Möglichkeiten, wie diese räumlichen Informationen in ein Modell einfließen können, z. B. Nachbarschaft (ein qualitatives Maß), Längen- und Breitengrad, Entfernung zur nächsten Schule usw. Bei der Wahl, wie diese Daten in der Modellierung kodiert werden, können wir eine Option wählen, von der wir glauben, dass sie am meisten mit dem Ergebnis zu tun hat. Das ursprüngliche Format der Daten, z. B. numerisch (z. B. Entfernung) oder kategorisch (z. B. Nachbarschaft), ist ebenfalls ein wichtiger Faktor bei der Auswahl der Merkmale.
Weitere Beispiele für die Vorverarbeitung zur Erstellung besserer Merkmale für die Modellierung sind:
-
Die Korrelation zwischen Prädiktoren kann durch die Extraktion von Merkmalen oder das Entfernen einiger ...
Get Aufgeräumtes Modellieren mit R now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.