詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンス
by Denny Lee, Tristen Wentling, Scott Haines, Prashanth Babu, 長谷川 亮, 倉光 怜, 小谷 尚太郎, 竹下 俊一郎
12章レイクハウスのガバナンスとセキュリティの基礎
私たちは毎日、多くのことを無意識に行っている。こうした反復的な行動や自動的な振る舞いは、日々のルーティンや、長い時間をかけて信頼するようになった情報に基づいている。ルーティンは単純なものから複雑なものまであり、行動は論理的なカテゴリに分類されることもある。例えば、外出前に鍵をかけるというルーティンを考えてみよう。これはリスクを軽減するための一般的な行動である。このリスク軽減を単純な話として考えてみると、物理的な場所(エンティティ:自宅、車、オフィス)への不正なアクセスを防ぐために、アクセス制御(鍵付きの仕組み)が導入され、信頼が確認できたときのみ(鍵、資格情報)に正当なアクセスが許可されるようになっている。
単純に言えば、侵入を防ぐ唯一のものは鍵だけであり、鍵はロックを通じて、物理的な空間へのアクセスを許可する。しかし、その鍵の所持者は保護されたリソースの物理的な場所も知っている必要がある。これは物理的なセキュリティの一例である。このような考え方(メンタルモデル)として、レイクハウスに含まれるリソースに対して、階層的なガバナンスとセキュリティモデルのプランを構築する際に役立つ。結局のところ、レイクハウスとは安全な空間であり、私たちの身近にある大切なものを守る場所となる。ただし、私たちがその中に含まれるリソースを適切にガバナンスできている場合に限られる。
では、データリソースのガバナンスとは具体的に何なのか。また、ガバナンスの構成要素が多くある場合、どのように第一歩目を踏み出せばいいのだろうか。
|
この章では、レイクハウスに含まれるデータ資産(リソース)に対するスケーラブルなデータガバナンス戦略を設計するための基礎を提供する。可能な限り広い範囲を取り上げることを目的としているが、この章はレイクハウスのデータガバナンスの膨大な構成要素の参照的な章であると考えていただきたい。例えば、地域特有の規則や規制(GDPR、CCPA、忘れられる権利など)に関するコンプライアンスや強制執行の観点からのガバナンスについては扱わない。また非エンジニアリングや非技術的な観点からの一般的なガバナンスも対象外としている。 ... |
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access