第12章. メダリオンのガバナンスとセキュリティ
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
第11章では、大規模で複雑な組織でますます重要になってきている、Medallionアーキテクチャ内の分散化と連携モデルのニュアンスを探った。第12章では、堅牢なガバナンスとセキュリティプロトコルに焦点を移す。これらの側面の重要性は、いくら強調してもしすぎることはない。
この章では、連携モデルを効果的に管理するために必要なガバナンスとセキュリティの側面を包括的に概説する。まず、ガバナンスに関する詳細な議論から始め、ベストプラクティスとしてUnityカタログの使用を強調する。次に、データ・コントラクトと、異なるドメイン間でデータを安全かつ効率的に共有する上でのその役割を取り上げる。データカタログ内にデータコントラクトを実装し、メタストア設定を使用し、バージョン管理とコラボレーションのためにYAMLテンプレートをGitとともにデプロイする方法論を検討する。
最後に、データセキュリティとアクセス管理について詳しく見ていく。このセクションでは、Microsoft FabricやAzure Databricksのようなデータプラットフォームのセキュリティに焦点を当て、データへのアクセスが厳重に管理され、確立されたセキュリティプロトコルに従っていることを確認する。
この章が終わるころには、読者はMedallionアーキテクチャを効果的に管理し、データが貴重な資産であると同時に保護された資産であり続けることを確実にするために必要不可欠なガバナンスとセキュリティ対策について、しっかりと理解することができるだろう。
データガバナンス
大規模な連合アーキテクチャにおけるデータガバナンスは複雑である。データ品質、完全性、セキュリティがすべてのドメインで適切に管理されるよう、構造化されたアプローチが必要である。これを実現するには、Medallionアーキテクチャの各インスタンス内でデータを効果的に管理するための明確なガイドラインを確立する必要がある。これには、役割の定義、境界の設定、ブロンズ、シルバー、ゴールドの各レイヤーにわたるデータ管理が含まれる。メダリオンアーキテクチャでデータガバナンスを効果的に実装する方法をさらに掘り下げ、各レイヤーにおけるデータ管理の具体的な内容を検討しよう。その後、メダリオンアーキテクチャにおけるデータガバナンスの重要なコンポーネントであるUnity Catalogについて説明する。
メダリオン・アーキテクチャーの中でのガバナンス
データガバナンスの原則を実装し始めるには、アーキテクチャのソースシステムの側面から検討することを推奨する。ここでは、どのソース・システムが真正なデータを生成し、保持しているかを特定することから始める。次に、アプリケーションの役割()とデータの所有権を代入する。アプリケーションオーナーはデータ収集の問題に取り組み、データオーナーはデータ品質に焦点を当て、データプラットフォームと共有するデータを決定する。
次に、アプリケーション・ランドスケープ内の境界をマッピングする。密接に連携し、同じビジネス目的をサポートするオブジェクトをグループ化する。これらの境界を定義したら、各ドメインのドメインオーナーを任命する。この任命された "ペルソナ "が、そのドメインのプライマリ・コンタクトとして機能する。
注
ペルソナは、組織内のさまざまな役割(
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access