Kapitel 6. Andere Computer Vision Probleme

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im vorherigen Kapitel hast du einige wichtige praktische Techniken für das Training von Modellen in der Praxis kennengelernt. Überlegungen wie die Wahl der Lernrate und die Anzahl der Epochen sind sehr wichtig, um gute Ergebnisse zu erzielen.

In diesem Kapitel werden wir uns zwei weitere Arten von Bildverarbeitungsproblemen ansehen: Multi-Label-Klassifizierung und Regression. Das erste Problem tritt auf, wenn du mehr als ein Label pro Bild vorhersagen willst (oder manchmal gar keins), und das zweite, wenn deine Labels eine oder mehrere Zahlen sind - eine Menge statt einer Kategorie.

Dabei werden wir die Ausgangsaktivierungen, Ziele und Verlustfunktionen in Deep-Learning-Modellen genauer untersuchen.

Multi-Label-Klassifizierung

DieMultilabel-Klassifizierung bezieht sich auf das Problem der Identifizierung derKategorien von Objekten in Bildern, die nicht genau eine Art von Objekt enthalten. Es kann mehr als eine Art von Objekt geben, oder es gibt überhaupt keine Objekte in den gesuchten Klassen.

Dies wäre zum Beispiel ein guter Ansatz für unseren Bärenklassifikatorgewesen. Ein Problem mit dem Bären-Klassifikator, den wir inKapitel 2 eingeführt haben, war, dass das Modell, wenn ein Nutzer etwas hochgeladen hat, das gar kein Bär war, immer noch sagte, dass es entweder ein Grizzly-, Schwarz- oder Teddybär war ...

Get Deep Learning für Programmierer mit fastai und PyTorch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.