第13章 教師なしセグメンテーションのためのグラフと基礎モデル 教師なしセグメンテーションのためのグラフと基礎モデル
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
、3Dデータセットから意味のある情報を抽出することは難しい。我々は複雑な詳細を持つ膨大なデータを持っているが、高レベルのタスクに必要な統合されたインテリジェンスが欠けている。このギャップが、高度な3Dシーン理解の可能性を制限している。セマンティクスとトポロジーがなければ、椅子やテーブルのような個々のオブジェクトとその関係、部屋内での配置を抽出することはできない。これらを抽出するために3Dマシンラーニングを活用しよう。
教師あり学習は、ラベル付けされたデータによって発展するものである。しかし、大きなハードルは、3Dデータのラベル付きデータセットが少ないことである。多くのデータがなければ、このようなシステムの構築には限界がある。教師なしセグメンテーションの最先端の研究を活用すれば、特にそうだ。しかし、人間レベルの推論をコンピューターにもたらすには、観察した3Dエンティティから形式化された意味を抽出することが重要である。
本章で3D点群、グラフ理論、インタプリタ学習を組み合わせ、視覚世界を解釈するための新たなシーン理解能力を解き明かすのはこのためだ。これらの進歩の中で、2つの主要な解決策に注目したい:
-
基礎モデルを用いた画像ベースの3Dセグメンテーション:セグメント何でもモデル
セマンティック・セグメンテーションと、この章で議論するセグメンテーションとは、決定的に異なる。セマンティック・セグメンテーションは、"椅子 "や "車輪 "のように、あらかじめ定義された 意味を持つラベルを代入することを目的としている。対照的に、第12章では、このような概念的にはラベル付けされていない点や 面をグループ化する(グループ1、グループ2、グループn)モデルに焦点を当てる。
この戦略には多くの利点がある。セマンティック・セグメンテーションとは対照的に、クラスタリングによる教師なしセグメンテーションは、学習データを必要としないため、効率と費用対効果が高くなる。
逆に、セマンティック・セグメンテーションは、多くの場合、相当量の注釈付きデータに依存する。したがって、ラベル付き3Dデータセットが少ないため、教師なしモデルが3Dマシン学習の中心となっている。さらに、教師なし学習は可能性の世界を提供する。モデルは特定のラベルセットに縛られない。データそのものに基づいて新たなグループ分けを発見することができ、これまで知られていなかった構造を明らかにし、新たな探求の道を開く可能性がある。
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access