Kapitel 5. Feature Engineering
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Im Jahr 2014 hieß es in dem Papier "Practical Lessons from Predicting Clicks on Ads at Facebook", dass die richtigen Merkmale das Wichtigste bei der Entwicklung von ML-Modellen sind. Seitdem haben viele der Unternehmen, mit denen ich zusammengearbeitet habe, immer wieder festgestellt, dass die richtigen Merkmale, sobald sie ein brauchbares Modell haben, im Vergleich zu cleveren algorithmischen Techniken wie dem Hyperparameter-Tuning den größten Leistungsschub bringen. Modernste Modellarchitekturen können immer noch schlecht abschneiden, wenn sie nicht die richtigen Merkmale verwenden.
Aufgrund ihrer Bedeutung besteht ein großer Teil vieler ML-Engineering- und Data-Science-Aufträge darin, neue nützliche Funktionen zu entwickeln. In diesem Kapitel gehen wir auf gängige Techniken und wichtige Überlegungen zum Feature Engineering ein. In einem eigenen Abschnitt gehen wir auf ein subtiles, aber verhängnisvolles Problem ein, das viele ML-Systeme in der Produktion zum Scheitern gebracht hat: Datenlecks und wie man sie erkennt und vermeidet.
Am Ende des Kapitels werden wir besprechen, wie man gute Merkmale entwickelt und dabei sowohl die Bedeutung als auch die Verallgemeinerung von Merkmalen berücksichtigt. Wenn man von Feature Engineering spricht, denken manche Leute vielleicht an Feature Stores. Da Feature Stores näher an ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access