Kapitel 50. Anwendung: Eine Gesichtserkennungs-Pipeline
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Teil des Buches haben wir einige der zentralen Konzepte und Algorithmen des maschinellen Lernens kennengelernt. Doch der Übergang von diesen Konzepten zu einer realen Anwendung kann eine Herausforderung sein. Reale Datensätze sind verrauscht und heterogen; sie können fehlende Merkmale enthalten und die Daten können in einer Form vorliegen, die sich nur schwer in einer sauberen [n_samples, n_features]
Matrix abbilden lässt. Bevor du eine der hier vorgestellten Methoden anwendest, musst du diese Merkmale aus deinen Daten extrahieren: Es gibt keine Formel, die für alle Bereiche gilt, und deshalb musst du als Datenwissenschaftler/in hier deine eigene Intuition und Expertise einsetzen.
Eine interessante und überzeugende Anwendung des maschinellen Lernens sind Bilder, und wir haben bereits einige Beispiele gesehen, bei denen Merkmale auf Pixelebene zur Klassifizierung verwendet werden. Auch hier sind die Daten in der realen Welt selten so einheitlich, und einfache Pixel sind nicht geeignet: Dies hat zu einer umfangreichen Literatur über Methoden zur Merkmalsextraktion für Bilddaten geführt (siehe Kapitel 40).
In diesem Kapitel werfen wir einen Blick auf eine solche Technik zur Merkmalsextraktion: dasHistogramm der orientierten Gradienten (HOG), das Bildpixel in eine Vektordarstellung umwandelt, ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.