第15章. 先を見据えて
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
自動のはずだが、実際にはこのボタンを押す必要がある。
ジョン・ブルナー『ザンジバルに立つ
こうして、我々はここにいる。データ・セマンティクスの世界を私と共に旅し、この世界を難しくもやりがいのあるものにしている多くの癖や課題を検証してきた。その過程で、重要な落とし穴を避け、重要なジレンマを打破するのに役立ついくつかのトリックを学んでいただければ幸いである。
最後の章では、本書で繰り返し取り上げたテーマをまとめ、それを基に未来を描いてみたい。
地図は領土ではない
私がこの本を落とし穴やジレンマを中心に構造化し、完璧なセマンティックモデルを構築するためのレシピを紹介しなかった主な理由は、あなたのドメイン、データ、アプリケーションのコンテキストにとって、そのようなモデルがどのように見えるかを私が知らないからである。 言い換えれば、私のマッピングは必ずしもあなたの領域を反映していない。
第11章で説明したように、あなたの意味モデルとそのコンテキストのための戦略を立てるために、一緒に座ってすべての作業をしない限り、私があなたに、他の言語ではなくあるモデリング言語を使うべきであるとか、他の言語を犠牲にしてある品質次元を最適化すべきであると言うことは、効果がないだけでなく、無責任でもある。その代わりに私は、あなたのコンテクストに潜在する危険とそれを回避する方法、そしてある選択や決定をすることであなたが負う可能性のあるリスクとそれを軽減する方法をお伝えすることにした。そうすることで、自分でパスを切り開くだけでなく、効果的にそのパスをナビゲートすることができるようになるのだ。
楽観主義者であるが、ナイーブではない
本書の主要な前提は、セマンティックデータモデリングのゴールは、、人間やマシンによる効果的なインタプリタや利用にとって重要なデータの意味の側面を、明確かつ正確で、一般的に理解される方法で伝えるデータの記述や表現を作成することである。セマンティック技術、ビッグデータ処理、自然言語処理、マシンラーニングが発展しているにもかかわらず、この難問はいまだ解決されていない。
これは悲観論ではなく、現実主義である。私たちデータ関係者が忘れがちな(あるいは軽視しがちな)ことは、意味論はほとんど常に合意に基づくものであり、合意形成は難しいという事実である。しかし、セマンティックモデルは、その根底にあるコンセンサスの範囲内でしか価値がなく、その(正しい)使用法は、それに反対する当事者によって保証されることはない。そして、ナレッジグラフや他のタイプのセマンティックモデルが、そのサイズや範囲が大きくなり、より大きく、より多様なオーディエンスによって使われるようになるにつれて、コンセンサスのある情報を表現する能力が強調されるようになる。
したがって、コンセンサスの問題にどう取り組むかを考えずにセマンティックモデルのイニシアチブを始めるのはナイーブであり、過去数年間にセマンティック・ウェブが受けた批判の多くは、まさにこれに関するものであった。例えば、インターネット技術の社会的・経済的影響に関する著名な思想家であるクレイ・シャーキー(Clay Shirky)は2003年にエッセイを発表し、セマンティックウェブの構想の問題点は「世界の多くの重要な側面が曖昧さのない普遍的に合意された方法で指定できることを当然と考え、それらの記述のための理想的なXMLフォーマットについて話すことに多くの時間を費やしている」ことだと示唆した ...