Capitolo 15. Deep Learning 3D con PyTorch
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Su le cose si fanno un po' più complesse. Gestire i dati 3D nelle architetture di deep learning è molto diverso dal lavorare con testi o immagini. Ma non preoccuparti: lo affronteremo passo dopo passo a un ritmo confortevole. Uno degli ostacoli principali risiede nella rappresentazione dei dati. I dati 3D possono essere trasmessi in vari formati, come nuvole di punti, mesh 3D o griglie di voxel, come illustrato nel Capitolo 4.
Ricordi i nostri precedenti esperimenti e scritti sulle strutture e le rappresentazioni dei dati in 3D? Sarai felice di sapere che si tratta di fattori cruciali quando si lavora con il deep learning 3D. Infatti, la scelta della rappresentazione dei dati 3D ha un impatto significativo sull'architettura e sui paradigmi della tua soluzione di deep learning 3D. A questo punto, possiamo distinguere tra quattro rappresentazioni di dati supportate dagli approcci di deep learning 3D: Cloud 3D, griglie voxel 3D, mesh 3D e dataset di immagini multiview.
Ogni rappresentazione ha i suoi punti di forza e le sue sfide, che influenzano la scelta dell'architettura di deep learning più adatta. Entrare nello specifico in questa fase sarebbe come gettarsi nel mare aperto prima di aver imparato a nuotare. Potresti sentirti sopraffatto dagli strati di complessità e finire per perderti completamente. ...