Kapitel 16. PointNet für die Klassifizierung von 3D-Objekten
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
3D Szenenverständnis, ein entscheidender Aspekt räumlicher KI-Systeme, hängt stark von der effektiven semantischen Extraktion von 3D-Daten ab. Die Kapitel 12 bis 14 haben es uns ermöglicht, sowohl unüberwachtes als auch überwachtes maschinelles 3D-Lernen für dieses Ziel zu nutzen, wenn wir nur über begrenzte Datensätze mit Markierungen verfügen. Wenn du jedoch von großen Datenbeständen profitierst, ist 3D Deep Learning vielversprechend, was wir in Kapitel 15 mit 3D CNNs beleuchtet haben.
3D-CNNs sind jedoch ungeeignet, um die Komplexität von Punktwolken zu bewältigen, die unstrukturierte Datensätze ohne ein festes Raster oder eine pixelbasierte Darstellung sind. Diese Einschränkung unterstreicht den dringenden Bedarf an innovativen Ansätzen zur direkten Verarbeitung und Interpretation von Punktwolkendaten.
In der Tat gibt es verschiedene Methoden zur Darstellung und Verarbeitung von 3D-Daten, z. B. Voxel, Meshes und Multiview-Bilder (siehe Kapitel 4). Jede dieser Darstellungsformen hat jedoch ihre Nachteile. Voxel sind zwar für 3D-CNNs geeignet, können aber rechenintensiv und speicherintensiv sein, insbesondere bei hochauflösenden Daten. Meshes oder B-Reps, die mit GNNs verarbeitet werden, stellen eine Herausforderung für die Graphenkonstruktion und den Rechenaufwand dar. Multiview-CNNs, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access