第1章. データカタログ入門
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
この章では、データカタログがどのように機能するのか、誰が使うのか、なぜ使うのかを学ぶ。まず、データカタログの中核となる関数について説明し、データカタログがどのように組織のITランドスケープの概要を作成し、データがどのように整理され、データの検索をどのように容易にするかについて説明する。検索はデータカタログの一部として十分に活用されておらず、過小評価されがちである。そこで今回は、成功の可能性を引き出す検索エンジンとしてのデータカタログについて解説する。
この章では、組織におけるデータカタログの利点についても学ぶ。データカタログはデータの発見性を向上させ、データガバナンスを確保し、データ主導のイノベーションを強化する。さらに、データ・ディスカバリー・チームのセットアップ方法についても学び、データ・カタログのユーザが誰であるかについても学ぶ。データカタログにおける役割と責任について説明することで、この章を締めくくることにする。
よし、出発だ。
データカタログの中核機能
、データ・カタログの核心は、社内のデータの整理された目録である。それだけだ。
データ・カタログはメタデータ・レベルでの概要のみを提供するため、実際のデータ値が公開されることはない。これがデータカタログの大きな利点である。機密データやセンシティブなデータの漏洩を恐れることなく、すべての人にすべてを見せることができる。図1-1にデータカタログの概要を示す。
図1-1. データ・カタログのハイレベル・ビュー
データカタログは基本的に、ある企業のITランドスケープにあるデータソースからプッシュまたはプルされたメタデータを含むデータベースである。データ・カタログはまた、データ・ソースから収集されたメタデータを検索するための検索エンジンを内蔵している。データカタログはほとんどの場合もっと多くの機能を持つが、図1-1は必要なコアコンポーネントを示している。そして本書では、検索機能こそがデータカタログの唯一にして最も重要な機能であると主張する。
このセクションでは、データ・カタログの3つの主な特徴、すなわち、ITランドスケープにおけるデータの概要を作成すること、データを整理すること、データを検索できるようにすることについて説明する。データ・カタログがどのように機能するのか、簡単に見てみよう。
注
データ・カタログを使えば、組織全体が保有するデータを見ることができる。正しく使用すれば、その透明性は非常に有益なものとなる。例えば、データ検索に時間の半分を費やす必要がなくなり、真に価値を提供できるデータの概要がより明確になる。可能性を想像してみてほしい。彼らは新たに得た時間を使ってデータを分析し、企業をより良い製品開発へと導く洞察を発見することができるだろう!
IT状況の概要を作成する
ITランドスケープの概要の作成には、ITランドスケープ内のすべてのデータソースを発見し、表示することと、そのデータソースに所属する人やロールのリストが含まれる。
データカタログは、ITランドスケープをスキャンする内蔵クローラーを使ってメタデータを引き出すことができる。あるいは、データシステムにメタデータをカタログに報告させることで、メタデータをプッシュさせることもできる。プッシュとプルについては、 ...