Capitolo 16. PointNet per la classificazione degli oggetti 3D
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
La comprensione della scena 3D, un aspetto cruciale dei sistemi di intelligenza artificiale spaziale, dipende in larga misura dall'efficace estrazione semantica dei dati 3D. I capitoli dal 12 al 14 ci hanno permesso di sfruttare l'apprendimento automatico 3D non supervisionato e supervisionato per raggiungere questo obiettivo, quando disponiamo di set di dati etichettati limitati. Tuttavia, quando si dispone di archivi di dati su larga scala, il deep learning 3D si rivela promettente, come abbiamo evidenziato nel Capitolo 15 con le CNN 3D.
Tuttavia, le CNN 3D sono inadeguate a gestire le complessità delle nuvole di punti, che sono insiemi di dati non strutturati senza una griglia fissa o una rappresentazione basata sui pixel. Questa limitazione evidenzia la necessità di approcci innovativi per elaborare e interpretare direttamente i dati delle nuvole di punti.
Esistono infatti diversi metodi per rappresentare ed elaborare i dati 3D, come voxel, mesh e immagini multiview (vedi Capitolo 4). Tuttavia, ognuna di queste rappresentazioni presenta degli svantaggi. Sebbene siano adatti alle CNN 3D, i voxel possono essere intensivi dal punto di vista computazionale e richiedere molta memoria, soprattutto per gli input ad alta risoluzione. Le mesh o le B-rep, elaborate con le CNN di , presentano ...