第3章 スキーマ スキーマ
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
スキーマ・ディープ・ダイブ入門
AIシステムに何をさせたいのか?それをどのように達成するのか?どんなメソッドを使うのか?
この章では、人間の意味とマシンラーニングのマッピングであるスキーマにまつわる基礎概念のいくつかに飛び込む。
現実の世界は混乱している。商業的なアプリケーションは、超ドメイン固有の詳細なレベルを必要とする。この複雑さを構造化する方法はたくさんある。一般化すると、これらの構造はスキーマで定義される。さらに、スキーマは、現在のニーズにより適合するように、時間の経過とともにサブコンポーネントを適応させ、変更するための「ピボット点」を提供する。
生データを含むシステムの残りの部分はスキーマに関連して定義されるため、スキーマを正しく設定することは重要である。
スキーマは、 すべての商用知識をエンコーディングするためのパラダイムである。これは大まかにラベルと 属性(何かが何であるか)、空間的表現(何かがどこにあるか)、それらの相互関係、外部概念(シリーズ、時間など)との関係と考えることができる。効果的なスキーマは、ビジネス・ニーズと生データにうまく関係する。
より一般的には、スキーマとはラベル、属性、空間情報、およびそれらの相互関係の全体的な表現である。スキーマは、何かが何であるか、どこにあるかなどの意味を考え、表現する方法である。これは、第1章で紹介したラベルと属性の上位概念に基づいている。その後で、これらの学習データの概念をマシン学習のタスクにマッピングしていく。
この章では、次のことを学ぶ:
最初のスキーマを設定するためのメンタルモデル
スキーマの拡張の方向性を概観する。
一般的なメソッドとタスクのトレードオフ
第1章のハイレベルなアイデアの具体例
スキーマに飛び込もう!
ラベルと属性-それは何か?
ラベルと属性は、何かが「何」であるか、生データの意味が人間レベルで何であるかを定義する。つまり、私たちが気にかけ、システムに学習させたい「何か」を定義する。商業的な文脈では、それらは生データが我々のビジネスにとって何を意味するかを定義する。このセクションでは、ラベルと属性が他の概念(空間タイプなど)とどのように関係しているかについて説明する。ラベルと属性を使用することは、構造化された方法で人間の意味を定義しマッピングし、その意味を専門用語にマッピングすることである。ラベルと属性は一緒になってスキーマの中心を形成する。
我々は何に関心があるのか?
一般化すれば、私たちは何かがどこにあるのか、それが何なのか、他のものとどう関係しているのかを気にする。
ラベルと属性は、何かが "何 "であるかを表現するために、。次のセクションでは、何かが「どこにあるのか」を議論するために空間タイプを紹介する。
何かが何であるかを表現する概念は無限大に近い複雑さで拡張することができるが、空間的な位置の側面は一般的にその拡張にもっと明白な限界がある。言い換えれば、"何か "を正しく表現することは、文書や画像の "どこに "何かがあるかという機械的な詳細を理解することよりも、より大きな継続的課題なのである。
トレーニングデータのスキーマは、データベースのスキーマと同様に扱われるべきである(例えば、テーブル、ビュー、データ型などを持つPostgresのスキーマのように)。