第3章 検索を理解する 検索を理解する:概念、特徴、メカニズム
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
ドメインを作成し、そこにデータソースをプルまたはプッシュし、メタデータを追加する。これで、データ・カタログを検索する準備が整った。
しかし、なぜデータカタログを検索する必要があるのか?データカタログで検索するのはいったい何なのか?そして実際にどのように検索するのか?単純な検索はどの程度優れているのだろうか?どうやってデータをブラウズするのか?複雑なトピックを検索するにはどうすればいいのか?この章ではこれらの疑問について述べる。
この章では、データカタログをなぜ、何を、どのように検索するのかについて説明する。また、データカタログの関数についての理解を深めるために、検索の仕組みについても取り上げる。
まず、その理由を説明しよう。
なぜデータカタログで検索するのか?
なぜデータカタログを検索するのか?短い答えは、実は " データ発見のため "である。
一般の従業員に「なぜデータカタログを検索するのですか」と尋ねれば、「問題を解決するために情報が必要だから」と答えるかもしれない。ガバナンス・エンド・ユーザに尋ねれば、"法令を遵守するために、どのような情報が必要だから "と答えるかもしれない。データ分析のエンドユーザに尋ねれば、"傾向を分析して改善を行うためにデータが必要だから "と答えるかもしれない。
この3つの答えはすべて正解であり、3つともデータ・ディスカバリーと関係がある。組織内にどのようなデータがあるのかを知りたければ、データ・カタログが検索場所となる。そこからデータ・ディスカバリーが始まるのだ。
第1章では、データカタログにおける3種類のエンドユーザについて説明した:
-
日常のエンドユーザ
-
ガバナンス・エンドユーザ
-
データ分析エンドユーザ
これらのエンドユーザはそれぞれ、検索プロセスの出発点としてデータカタログを使用するはずである。エンドユーザを一人ずつ見ていこう。
日々のエンドユーザ は、あなた自身を含む、あなたの会社のすべての従業員である。エンドユーザは、あなたの会社の全従業員と同じように多様な人々のグループであると考えよう。ヒュージン&ムニンでは、日常のエンドユーザは、アーキテクト、エンジニア、営業担当者、さまざまな職人など、多岐にわたる。
エンドユーザはあらゆるものを探している-例えば、文書やSOP、あるいは自分たちのビジネス分野に関する分析的洞察などだ。日常的にエンドユーザは、自分の仕事を適切にこなすことから生じる情報ニーズを持っている。ユーザは通常、高速で単純な方法で検索を行い、1つか2つの単語を入力し、適切なヒットを発見することを望む。
データカタログが企業の検索エンジンに進化するにつれて、日常的なエンドユーザが現れるだろうが、ほとんどのデータカタログではまだ広く普及しているユーザグループではない。第8章では、より多くの日常ユーザのシナリオと、それらが将来どのように進化していくかを見ることができるだろう。
ガバナンス・エンド・ユーザ は、貴社のデータ・ガバナンス・プログラムの担当者である。例えば、 DPOやCISOのコンプライアンス・マネージャーやスタッフがこれに該当する。このようなタイプのエンドユーザにとって、データカタログは真のデータディスカバリを提供する。つまり、これらの従業員がこれまで持っていた、しばしば手作業で更新されるデータのリストに代わる、自動化された強力な代替手段である。データカタログは、データガバナンスのエンドユーザに、組織内に実際に存在するデータの新鮮で最新の概要を提供する。データカタログが提供するこの概観によって、ガバナンス・エンドユーザは、個人を特定できるデータや機密データの管理を改善し、データ品質の向上に取り組み、重要な ...