Kapitel 11. Fortgeschrittene Sehprobleme
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Bislang haben wir uns in diesem Buch vor allem mit dem Problem befasst, ein ganzes Bild zu klassifizieren. In Kapitel 2 haben wir uns mit der Bildregression beschäftigt und in Kapitel 4 mit der Objekterkennung und Bildsegmentierung. In diesem Kapitel befassen wir uns mit fortgeschritteneren Problemen, die mit Computer Vision gelöst werden können: Messen, Zählen, Posenschätzung und Bildsuche.
Tipp
Der Code für dieses Kapitel befindet sich im Ordner 11_adv_problems im GitHub-Repository des Buches. Wir geben die Dateinamen für die Codebeispiele und die Notizbücher an, wo dies möglich ist.
Objektmessung
Manchmal wollen wir die Maße eines Objekts in einem Bild wissen (z. B. dass ein Sofa 180 cm lang ist). Während wir einfach eine pixelweise Regression verwenden können, um z. B. den Niederschlag am Boden anhand von Luftbildern der Wolkendecke zu messen, müssen wir für die Messung von Objekten etwas Anspruchsvolleres tun. Wir können nicht einfach die Anzahl der Pixel zählen und daraus eine Größe ableiten, denn ein und dasselbe Objekt kann durch eine unterschiedliche Anzahl von Pixeln dargestellt werden, je nachdem, wo es sich im Bild befindet, wie es gedreht ist, wie das Seitenverhältnis ist usw. Gehen wir die vier Schritte durch, die nötig sind, um ein Objekt anhand eines Fotos zu vermessen, und folgen dabei ...
Get Praktisches maschinelles Lernen für Computer Vision now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.