Skip to Content
Python を使った 3D データサイエンス
book

Python を使った 3D データサイエンス

by Florent Poux
April 2025
Intermediate to advanced
690 pages
10h 49m
Japanese
O'Reilly Media, Inc.
Content preview from Python を使った 3D データサイエンス

第16章. 3Dオブジェクト分類のためのPointNet

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

3D 空間AIシステムの重要な側面であるシーン理解は、3Dデータの効果的な意味抽出に大きく依存している。第12章から第14章では、ラベル付きデータセットが限られている場合、この目標のために教師なしと教師ありの両方の3Dマシン学習を活用することができた。しかし、大規模なデータ・リポジトリが利点となる場合、3D Deep Learningは有望であり、第15章では3D CNNで強調した。

しかし、3D CNNは、固定グリッドやピクセルベースの表現を持たない非構造データセットである点群の複雑さを扱うには不十分である。この限界は、点群データを直接処理しインタプリタする革新的なアプローチの必要性を浮き彫りにしている。

実際、ボクセル、メッシュ、マルチビュー画像など、3Dデータを表現し処理するためのさまざまなメソッドが存在する(第4章参照)。しかし、これらの表現にはそれぞれ欠点がある。ボクセルは3D CNNには適しているが、特に高解像度の入力では、計算量が多く、メモリーを必要とする。メッシュやB-レップは、GNNを使って処理されるが、グラフ構築と計算量に課題がある。マルチビューCNN( )は、複数の2Dビューで2D CNNを活用するものであるが、大規模な前処理を必要とし、固有の3D構造を完全に捕捉できない可能性がある。これらの限界は、3Dデータ処理に対する、より効率的で直接的なアプロ ーチの必要性を強調している(第15章参照)。

PointNetは、これらの制限に対処し、実用的な3Dシーン理解を可能にする極めて重要なソリューションとして登場した。この画期的なアーキテクチャは、生の点群データを直接処理し、ボクセルやメッシュのような中間表現の必要性を回避する。構造化されていない(表形式の)点群データを直接演算子として処理することで、PointNetは処理パイプラインを簡素化し、点群を他の表現に変換することに伴う情報損失を回避する。この特徴により、PointNetは、3Dシーン理解のための3D Deep Learningアプローチを発展させるための有力な研究分野となっている。

本章では、このアーキテクチャの複雑さを掘り下げ、3Dオブジェクト分類と3Dセマンティックセグメンテーションの可能性を明らかにする。PointNetのための点群データ準備の基本概念を探り、そのアーキテクチャとオブジェクト実装について議論し、オブジェクト分類のためのソリューションを実装する。

チップ

この章では、いくつかのPythonライブラリを活用する:NumPyPyTorchMatplotlibPlotlyOpen3Durllib(インターネットからファイルをダウンロードする、特にModelNet10データセット)、zipfile(ZIPアーカイブからファイルを抽出する、特にダウンロードしたModelNet10データセットを解凍する)、pathlib(ファイルパスをよりオブジェクト指向で扱う)、scikit-learn(学習済みPointNetの性能を評価するconfusion_matrix 関数を提供)。いつものように、3Dデータサイエンスリソースハブでこの章のすべての資料を見つけることができる。ファイル(コード、データセット、記事)やリソースにアクセスするには、電子メールアドレス、個人パスワード、または本の所有者であることの証明が必要な場合がある。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

Adrian Kaehler, Gary Bradski, 松田 晃一, 小沼 千絵, 永田 雅人, 花形 理

Publisher Resources

ISBN: 9798341640481