Microsoft Fabric Analytics Engineer Associateスタディガイド (Japanese Edition)
by Brian Bønk, Valerie Junk
第2章 データの取得
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データなしでは、どの分析プラットフォームも機能しない。この章では、Fabric環境内で直接、様々なメソッドを用いてデータをインポートする方法を学ぶ。
まず、Fabricポータル内のエントリポイントについて説明する。ここでは既存のデータ接続と新規データ接続を扱う。次に、Power BI DesktopとFabricポータルの両方を使って、異なる方法で新規接続を作成するプロセスを掘り下げる。その後、3つのデータストア(レイクハウス、ウェアハウス、イベントハウス)について解説する。 これら3つの選択は煩雑で困難に思えるかもしれないが、適切なデータ保存場所を選べるよう理解を深める手助けをする。章の締めくくりとして、OneLakeとイベントハウス間の統合設定方法と、このデータをデータ資産内のセマンティックモデルに接続する方法を示す。 また、すべてのデータを保存する OneLake サービス(1 つの例外を除く。詳細は後述)についても扱い、一元化された場所からデータを利用、共有、再利用する方法を示す。
OneLakeカタログとリアルタイムハブによるデータ発見
Microsoft Fabricでは、データ資産の全体像を把握するための2つの入り口がある。OneLakeカタログ()とリアルタイムハブだ。これらは用途が異なる。
OneLakeカタログは、OneLake内に存在するデータに関する洞察を提供する。ただし、アクセス権限を持つデータに限られる。Fabricサービス全体としてOneLakeにはより多くのデータが存在する場合でも、エンドユーザであるあなたは、最低限の読み取りアクセス権限を持つデータのみを閲覧・発見できる。
リアルタイムハブは、テナント内のリアルタイム成果物に関する情報を提供する。また、リアルタイムハブのセキュリティの観点も OneLake データハブと同様で、アクセス権限のあるものしか表示されない。
それでは、それぞれの詳細について見ていこう。
OneLake カタログ
OneLakeカタログは、レポートやインサイトの作業を始めたい新規ビジネスユーザにとって最初の入り口となり得る。また、Microsoft Fabricの新規ユーザが特定のアイテムを発見したり、新しいアイテムを発見したりする際の定番の出発点となる場合もある。ワークスペースを直接開き、OneLakeカタログ内のアイテムの作業を始める方法が、最も簡単なスタート方法だと感じるユーザもいるだろう。
OneLakeカタログは、データソースからのデータ取得を目的とした統合開発の起点としても設計されている。利用可能なデータの概要を提供し、Fabricテナント内に存在する既存要素を容易に発見できるようにする。
通常、データ分析エンジニアはあらゆるデータにアクセスできることを望むが、現実にはそうとは限らない。現代の多くの組織では、開発者やエンジニアのデータやアイテムへのアクセスを制限しているからだ。したがって、OneLakeカタログを利用する各ユーザは、アイテムやワークスペースへのアクセス権限に基づいて、テナント内の全アイテムからフィルタリングされたビューのみを閲覧することになる。
図 2-1 はOneLake カタログの異なる領域を示している。
図2-1. OneLake カタログの概要
これらの領域(1~5番)の詳細は以下の通りだ: ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access