Kapitel 5. Erstellen von Vision-Datensätzen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Um maschinelles Lernen mit Bildern durchzuführen, brauchen wir Bilder. Von den Anwendungsfällen, die wir in Kapitel 4 betrachtet haben, waren die meisten für überwachtes maschinelles Lernen. Für solche Modelle brauchen wir auch die richtige Antwort, das sogenannte Label, um das ML-Modell zu trainieren. Wenn du ein unüberwachtes ML-Modell oder ein selbstüberwachtes Modell wie einen GAN oder Autoencoder trainieren willst, kannst du die Labels weglassen. In diesem Kapitel werden wir uns ansehen, wie man einen Datensatz für maschinelles Lernen erstellt, der aus Bildern und Beschriftungen besteht.

Tipp

Der Code für dieses Kapitel befindet sich im Ordner 05_create_dataset im GitHub-Repository des Buches. Wir geben die Dateinamen für die Code-Beispiele und die Notizbücher an, wenn sie zutreffen.

Bilder sammeln

Bei den meisten ML-Projekten besteht der erste Schritt darin, die Daten zu sammeln. Die Datenerfassung kann auf verschiedene Weise erfolgen: durch das Anbringen einer Kamera an einer Verkehrskreuzung, die Verbindung zu einem digitalen Katalog, um Fotos von Autoteilen zu erhalten, den Kauf eines Archivs mit Satellitenbildern usw. Dabei kann es sich um eine logistische Aktivität (Montage von Verkehrskameras), eine technische Aktivität (Erstellung einer Softwareverbindung zur Katalogdatenbank) oder eine ...

Get Praktisches maschinelles Lernen für Computer Vision now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.