第14章. 教師あり3Dマシン学習の基礎
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
私たちは 、人間と同じように空間を正確に認識できるマシンを設計することを目指している。つまり、奥行きを理解し、空間関係を予測し、オブジェクトを認識し、デジタル環境においてインテリジェントな判断を下すということだ。これは複雑な目標だが、チャンクに分けると管理しやすくなる。前の章では、最初の2つのチャンク、つまり奥行きの理解と空間的関係の発見を解決した。しかし、明確な概念を持つオブジェクトを認識するのはどうだろうか?
これにより、医療画像を解析して腫瘍などの異常を検出し、医師が診断や治療計画を立てるのに役立つシステムを構築できる可能性がある。ヘルスケア以外にも、自動運転車は複雑な環境を安全にナビゲートするために3D知覚に大きく依存している。我々は、LiDARセンサーとカメラを使って障害物、歩行者、交通標識を識別することで、自律走行支援を作成することができる。繰り返しになるが、第1章で詳述した全ての3Dデータサイエンス・アプリケーションは、意味抽出に依存している。
しかし、複雑な3Dデータを意味のある洞察に変換することが基本的な課題である。教師あり学習モデルによる3Dマシン学習は、この文脈において重要なパラダイムシフトをもたらす。
点群、深度マップ、メッシュ、ボリューム表現はすべて、従来のアルゴリズムが解釈するのに苦労する複雑な情報を含んでいる。以前、教師なし学習が3D環境の全体的な意味を「解読」するのに役立つことを見た。これはオブジェクトの完全な意味記述への第一歩である。しかし、3Dシーンの完全な理解のためには、もう一歩前進する、つまり、主要な構成要素に意味を与える必要がある。
本章の目的は、計算システムに空間データを理解することを「教える」のに役立つ教師あり学習ソリューションを発見することである。我々は、(第6章から第9章で抽出されたような)洗練された特徴を活用し、それらを「真実のラベル」と組み合わせることで、未見の3Dデータセットにおける意味ラベルを予測できる3Dマシン学習モデルを設計したい。
注
教師あり学習AIの足跡を認識することができる3つのハイレベルなタスクを紹介しよう:3D再構成、3Dシーン理解、3Dビジュアライゼーションだ。これらのタスクの中で、より特殊化されたタスクは、生成AI、差別化レンダリング、前章で説明した大規模言語モデルを活用する。これらはエキサイティングな道ではあるが、この章の教えの一部であるいくつかの中核概念をどのように構築するかを理解することが不可欠である。
この章の終わりには、図14-1に示すワークフロー の3つの主要セクションを経ることで、3Dシーン理解モデルを作成、トレーニング、デプロイするスキルを身につけることができる。
図14-1. 3Dマシン学習の基礎ワークフロー
最初のセクションでは、教師あり学習と教師なし学習を比較し、教師あり学習がシーン内のオブジェクトに意味を代入することで、3Dシーンのより深い理解を可能にすることを強調する。この章では、3Dセマンティック・セグメンテーションに焦点を当て、教師あり学習の特定のタイプである、すべてのデータ単位(点、ボクセル、三角形など)が分類され、3D環境の包括的な理解につながる。最後に、3Dディープラーニングアーキテクチャとの違いに移り、今後の章を紹介する。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access