Kapitel 10. Bildklassifizierung mit Faltungsneuronalen Netzen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Computer Vision ist ein Teilbereich des Deep Learning, bei dem Computer Informationen aus Bildern erkennen. Zu den praktischen Anwendungen gehören das Identifizieren von Objekten auf Fotos, das Entfernen unangemessener Bilder von Social Media Sites, das Zählen der Autos in der Schlange an einer Mautstelle und das Erkennen von Gesichtern auf Fotos. Computer-Vision-Modelle können sogar mit Modellen der natürlichen Sprachverarbeitung (NLP) kombiniert werden, um Fotos zu beschriften. Ich habe im Urlaub ein Foto geschossen und den Computer Vision Service von Azure gebeten, es zu beschriften. Das Ergebnis ist in Abbildung 10-1 zu sehen. Es ist schon bemerkenswert, wenn man bedenkt, dass kein menschliches Eingreifen erforderlich war.

Abbildung 10-1. "Ein Gewässer mit einem Steg und einem Gebäude im Hintergrund"-Azure AI

Der Bereich des maschinellen Sehens hat in den letzten Jahren rasante Fortschritte gemacht, vor allem dank der Faltungsneuronalen Netze, auch bekannt als CNNs oder ConvNets. Im Jahr 2012 übertraf ein achtschichtiges CNN namens AlexNet bei der jährlichen ImageNet Large Scale Visual Recognition Challenge (ILSVRC) mit einer Fehlerquote von 15,3 % bei der Erkennung von Objekten ...

Get Angewandtes maschinelles Lernen und KI für Ingenieure now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.