Kapitel 12. Objekt-Erkennung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im vorherigen Kapitel wurden zwei beliebte Algorithmen zur Erkennung von Gesichtern auf Fotos vorgestellt: Viola-Jones, der auf maschinellem Lernen basiert, und MTCNNs, die auf Deep Learning beruhen. Die Gesichtserkennung ist ein Spezialfall der Objekterkennung, bei der Computer Objekte in Bildern erkennen und identifizieren. Die Identifizierung eines Objekts ist ein Problem der Bildklassifizierung, das CNNs hervorragend lösen können. Die Suche nach Objekten, die identifiziert werden sollen, stellt jedoch eine andere Herausforderung dar.

Die Erkennung von Objekten ist eine Herausforderung, denn es wird nicht davon ausgegangen, dass die Objekte perfekt zugeschnitten und ausgerichtet sind, wie es bei der Bildklassifizierung der Fall ist. Auch sind sie nicht auf ein Objekt pro Bild beschränkt. Abbildung 12-1 zeigt, was ein selbstfahrendes Auto sehen könnte, wenn es Videobilder von einer nach vorne gerichteten Kamera scannt. Ein CNN, das mit sorgfältig vorbereiteten Trainingsbildern für die konventionelle Bildklassifizierung trainiert wurde, kann hier nicht helfen. Er kann das Bild vielleicht als eine Straße in einer Stadt klassifizieren, aber er kann nicht feststellen, dass das Bild Autos, Menschen und Ampeln enthält, geschweige denn, dass er deren Standorte genau bestimmen kann.

Die Objekterkennung ist in den letzten Jahren ...

Get Angewandtes maschinelles Lernen und KI für Ingenieure now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.