第12章. Snowflakeデータクラウドのワークロード
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データ ワークロードとは、データ取得やデータアクセスを支援し、データから価値を抽出したり、他の人が利用できるものを開発するための基盤となる機能、サービス、またはプロセスのことである。これまでの章では、Snowflakeの構成要素をマスターし、Snowflakeのパワーを活用する方法を学ぶことに時間を費やしながら、データワークロードに対するSnowflakeの基礎から構築されたアプローチの多くの例を見てきた。
この章では、Snowflake データプラットフォームからビジネス価値を提供するために、多くの Snowflake ワークロードをどのように適用するかに焦点を当てる。データエンジニアリング、データウェアハウス、データレイク、データ分析、およびデータサイエンスのワークロードを含む Snowflake ワークロードをすべて要約する(図 12-1 に示す)。
さらに、データコラボレーションワークロードを取り上げ、データの収益化のためにSnowflakeのセキュアデータ共有機能を活用する方法について議論する。また、大規模なデータ集約型アプリケーションの開発に使用されるSnowflakeのデータアプリケーションワークロードの例をいくつか紹介する。さらに、新しいSnowflakeワークロード、サイバーセキュリティ、セキュリティデータレイクとしてのSnowflakeの使用についても学ぶ。最後に、分析データとトランザクションデータを統合するために使用できるSnowflakeの最新ワークロード、Unistoreについて学ぶ。
図 12-1. Snowflake ワークロード
準備作業
Chapter12 Workloads」というタイトルの新しいフォルダを作成する。新しいフォルダとワークシートの作成にヘルプが必要な場合は、"Snowsightワークシートのナビゲー ション "を参照する。ワークシートコンテキストをセットするには、SYSADMINロールとCOMPUTE_WH仮想ウェアハウス を使用していることを確認する。
以下のコードで、キャッシュされた結果を使わないようにセッションを変更していることに気づくだろう。その理由は、クエリの実行にかかる時間を確認したいからで、2回目にクエリを実行したときにキャッシュ結果がパフォーマンスに影響しないようにしたいからだ:
USEROLESYSADMIN;USEWAREHOUSECOMPUTE_WH;CREATEORREPLACEDATABASEDEMO12_DB;CREATEORREPLACESCHEMACYBERSECURITY;ALTERSESSIONSETUSE_CACHED_RESULT=FALSE;
データエンジニアリング
データエンジニアリングの目標は、データの抽出、変換、ロード、集約、ストア、検証である。これらの目標を達成するために、データエンジニアは効率的なデータパイプラインを構築する必要がある。データ パイプラインは現代の企業の生命線であり、効率的なデータパイプラインは、ビジネスに真の価値をもたらすアーキテクチャと、重荷となるアーキテクチャの分かれ目となる。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access