book

Snowflake：定義ガイド

Name: Snowflake：定義ガイド
Author: Joyce Kay Avila
ISBN: 9798341624566

by Joyce Kay Avila

March 2025

Beginner to intermediate

468 pages

7h 36m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
本の起源この本は誰のためのものか？本の目標本書のナビゲーションコード例を使う本書で使用されている慣例オライリー・オンライン・ラーニング問い合わせ先謝辞
1.はじめに
Snowflake Webユーザインタフェース準備作業スノーサイト・オリエンテーションスノーサイトの好みスノーサイトのワークシートコンテクストのセット生産性の向上雪片コミュニティSnowflake認定資格スノーデーとSnowflakeサミットのイベント本書のコード例に関する重要な注意事項コードのクリーンアップ概要知識チェック
2.Snowflakeアーキテクチャの作成と管理
準備作業従来のデータプラットフォームアーキテクチャ共有ディスク（スケーラブル）アーキテクチャシェアード・ナッシング（スケーラブル）アーキテクチャNoSQLの代替Snowflakeアーキテクチャクラウドサービス層クラウドサービス層を管理するクラウドサービスレイヤーの課金クエリ処理（仮想倉庫）コンピュートレイヤー仮想倉庫のサイズ大規模データと複雑なクエリを処理するために仮想ウェアハウスをスケールアップするマルチクラスター仮想ウェアハウスでスケールアウトし、同時実行性を最大化するバーチャル・ウェアハウスの作成と使用ワークロードの分離とワークロード管理仮想倉庫レイヤーの課金集中型（ハイブリッド・カラムナー）データベース・ストレージ層ゼロコピークローニング入門タイムトラベル入門ストレージ層への課金雪片キャッシュクエリ結果キャッシュメタデータキャッシュ仮想倉庫ローカルディスクキャッシュコードのクリーンアップ概要知識チェック
3.Snowflake Securableデータベースオブジェクトの作成と管理
準備作業Snowflakeデータベースの作成と管理Snowflakeスキーマの作成と管理情報スキーマACCOUNT_USAGE スキーマスキーマオブジェクト階層Snowflakeテーブル入門ビューの作成と管理Snowflake Stagesの紹介：ファイル形式を含むストアドプロシージャとUDFでSQLを拡張するユーザ定義関数（UDF）：タスクを含む表形式の値を返す安全なSQL UDTF（マーケット・バスケット分析の例）ストアドプロシージャパイプ、ストリーム、シーケンス入門Snowflakeストリーム（ディープ・ダイブ）Snowflakeタスク（ディープダイブ）コードのクリーンアップ概要知識チェック
4.Snowflake SQLコマンド、データ型、関数を調べる
準備作業SnowflakeでSQLコマンドを使うDDLコマンドDCLコマンドDMLコマンドTCLコマンドDQLコマンドSnowflakeにおけるSQLクエリの開発、構文、演算子SQLの開発と管理クエリの構文クエリ演算子長時間クエリ、クエリのパフォーマンスと最適化Snowflakeクエリ制限Snowflakeがサポートするデータ型の紹介数値データ型文字列とバイナリデータ型日付と時刻の入出力データ型半構造化データ構造非構造化データ型Snowflakeは非構造化データの活用をどのようにサポートしているかSnowflake SQL関数とセッション変数システム定義（組み込み）関数を使うSQLとJavaScript UDFの作成とセッション変数の使用外部関数コードのクリーンアップ概要知識チェック
5.Snowflakeアクセス・コントロールの活用
準備作業Snowflakeオブジェクトの作成Snowflakeシステム定義の役割カスタムロールの作成機能レベルのビジネスとITの役割システムレベルのサービスアカウントとオブジェクトアクセスロールロールの階層代入：他のロールにロールを代入するロールに特権を与えるユーザに役割を代入する仕事のテストと検証ユーザ管理役割管理Snowflakeマルチアカウント戦略SCIMでユーザとグループを管理するコードのクリーンアップ概要知識チェック
6.データのロードとアンロード
準備作業データのロードとアンロードの基本データタイプファイル形式データファイル圧縮データ処理の頻度Snowflakeステージの参考文献データソースデータローディングツールINSERT INTOおよびINSERT ALLコマンドを使用したSnowflakeワークシートSQLWeb UI ロード・データ・ウィザードSnowSQL CLI SQL PUT および COPY INTO コマンドデータパイプラインサードパーティのETLおよびELTツールデータをロードする代替手段データをアンロードするツールSnowflakeデータエンジニアのためのデータロードのベストプラクティス適切なデータ・ロード・ツールを選択し、適切なデータ型のオプションを検討する行ごとのデータ処理を避ける適切なSnowflake仮想倉庫のサイズを選択し、必要に応じてファイルを分割するデータを段階的に変換し、中間結果を得るためにトランジェント・テーブルを使用するコードのクリーンアップ概要知識チェック
7.データガバナンス、アカウントセキュリティ、データ保護と復旧の実装
準備作業雪片セキュリティアカウント・アクセスを制御するSnowflake ACCESS_HISTORY アカウント使用状況ビューでアクティビティを監視するデータ保護と復旧レプリケーションとフェイルオーバーデータガバナンス・コントロールでデータを民主化するINFORMATION_SCHEMA データ辞書オブジェクトのタグ付け分類データマスキング行アクセス・ポリシーと行レベルのセキュリティ外部トークン化セキュアなビューとUDFオブジェクトの依存関係コードのクリーンアップ概要知識チェック
8.Snowflakeアカウントコストの管理
準備作業雪印月次請求書保管料データ転送コスト消費クレジットを計算するリソースモニターを作成して仮想倉庫の使用状況を管理し、コストを削減するリソースモニタークレジット枠リソースモニタークレジット使用状況リソースモニターの通知とその他のアクション代入に関するリソースモニターの規則リソースモニターの作成と管理のためのDDLコマンドコストセンターにオブジェクトタグを使用するACCOUNT_USAGEビューをクエリするBIパートナーのダッシュボードを使用してSnowflakeの使用状況とコストを監視するSnowflakeアジャイルソフトウェアデリバリーなぜDevOpsが必要なのか？継続的データインテグレーション、継続的デリバリ、継続的デプロイメントデータベース変更管理とは何か？ゼロコピークローニングは、どのように開発／テスト環境をサポートするために使用できるか？コードのクリーンアップ概要知識チェック
9.Snowflakeクエリパフォーマンスの分析と改善
準備作業クエリのパフォーマンスを分析するQUERY_HISTORY プロファイリングHASH()関数ウェブUIの歴史Snowflakeのマイクロパーティション分割とデータのクラスタリングを理解するパーティションについてSnowflakeマイクロ・パーティションの説明Snowflakeデータ・クラスタリングの説明クラスタリングの幅と深さクラスタリング・キーを選ぶクラスタリング・キーの作成再クラスタリングマテリアライズド・ビューの性能上の利点他のクエリ最適化テクニックを探る検索最適化サービスクエリ最適化テクニックの比較概要コードのクリーンアップ知識チェック

10.安全なデータ共有の設定と管理
Snowflake アーキテクチャーのデータ共有サポートスノーグリッドの力データ共有の使用例SnowflakeはユニファイドID 2.0をサポートするSnowflake 安全なデータ共有のアプローチ準備作業Snowflakeの直接安全なデータ共有アプローチアウトバウンドシェアの作成インバウンドシェアはSnowflakeデータコンシューマによってどのように利用されているか？公開されたSnowflakeマーケットプレイスにリストアップし、買い物をする方法プロバイダー向けSnowflakeマーケットプレイス標準リストとパーソナライズド・データリストの比較Snowflakeプライベート・データ・エクスチェンジのパワーを活用するSnowflake データ・クリーンルーム設計、セキュリティ、性能に関する重要な考慮事項設計上の考慮事項を共有するセキュリティに関する考慮事項を共有する株式パフォーマンスに関する考察データベース共有とデータベースクローニングの違いデータ共有とタイムトラベルデータ共有概要コードのクリーンアップ知識チェック
11.Snowsightでデータを可視化する
準備作業スノーサイトでのデータサンプリング特定の行数に基づく固定サイズのサンプリング確率に基づく分数ベースのサンプリングフィールドとデータをプレビューするサンプリング例自動統計とインタラクティブな結果を使うスノーサイト・ダッシュボードの可視化ダッシュボードとタイルの作成チャート・ビジュアライゼーションで作業するデータの集約とバケット化タイルの編集と削除コラボレーションクエリ結果を共有するプライベートリンクを使ってダッシュボードの共同作業を行う概要コードのクリーンアップ知識チェック
12.Snowflake Data Cloudのワークロード
準備作業データエンジニアリングデータ・ウェアハウスデータVault 2.0のモデリングSnowflake内でデータを変換するデータレイクデータ・コラボレーションデータ収益化データ共有のための規制およびコンプライアンス要件データ分析経理業界のための高度なアナリティクスヘルスケア業界のための高度なアナリティクス製造業とロジスティクス・サービスのための高度なアナリティクス小売業および通信・メディア産業のマーケティング分析データ・アプリケーションデータサイエンススノーパークストリームライトサイバーセキュリティ Snowflakeをセキュリティデータレイクとして活用するSIEMのみのアーキテクチャの課題を克服する検索最適化サービスとクラスタリングの比較ユニストアトランザクションワークロードと分析ワークロードの比較ハイブリッド・テーブル概要コードのクリーンアップ知識チェック
A.知識チェックの質問への回答
第1章第2章第3章第4章第5章第6章第7章第8章第9章第10章第11章第12章
B.Snowflake オブジェクトの名前付けのベストプラクティス
一般化（文字関連）一般化（文字には関係ない）標準ラベル略語
C.Snowflakeトライアルアカウントのセットアップ
インデックス
著者について

Content preview from Snowflake：定義ガイド

第12章. Snowflakeデータクラウドのワークロード

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

データワークロードとは、データ取得やデータアクセスを支援し、データから価値を抽出したり、他の人が利用できるものを開発するための基盤となる機能、サービス、またはプロセスのことである。これまでの章では、Snowflakeの構成要素をマスターし、Snowflakeのパワーを活用する方法を学ぶことに時間を費やしながら、データワークロードに対するSnowflakeの基礎から構築されたアプローチの多くの例を見てきた。

この章では、Snowflake データプラットフォームからビジネス価値を提供するために、多くの Snowflake ワークロードをどのように適用するかに焦点を当てる。データエンジニアリング、データウェアハウス、データレイク、データ分析、およびデータサイエンスのワークロードを含む Snowflake ワークロードをすべて要約する（図 12-1 に示す）。

さらに、データコラボレーションワークロードを取り上げ、データの収益化のためにSnowflakeのセキュアデータ共有機能を活用する方法について議論する。また、大規模なデータ集約型アプリケーションの開発に使用されるSnowflakeのデータアプリケーションワークロードの例をいくつか紹介する。さらに、新しいSnowflakeワークロード、サイバーセキュリティ、セキュリティデータレイクとしてのSnowflakeの使用についても学ぶ。最後に、分析データとトランザクションデータを統合するために使用できるSnowflakeの最新ワークロード、Unistoreについて学ぶ。

準備作業

Chapter12 Workloads」というタイトルの新しいフォルダを作成する。新しいフォルダとワークシートの作成にヘルプが必要な場合は、"Snowsightワークシートのナビゲーション "を参照する。ワークシートコンテキストをセットするには、SYSADMINロールとCOMPUTE_WH仮想ウェアハウスを使用していることを確認する。

以下のコードで、キャッシュされた結果を使わないようにセッションを変更していることに気づくだろう。その理由は、クエリの実行にかかる時間を確認したいからで、2回目にクエリを実行したときにキャッシュ結果がパフォーマンスに影響しないようにしたいからだ：

USE ROLE SYSADMIN;
USE WAREHOUSE COMPUTE_WH;
CREATE OR REPLACE DATABASE DEMO12_DB;
CREATE OR REPLACE SCHEMA CYBERSECURITY;
ALTER SESSION SET USE_CACHED_RESULT = FALSE;

データエンジニアリング

データエンジニアリングの目標は、データの抽出、変換、ロード、集約、ストア、検証である。これらの目標を達成するために、データエンジニアは効率的なデータパイプラインを構築する必要がある。データパイプラインは現代の企業の生命線であり、効率的なデータパイプラインは、ビジネスに真の価値をもたらすアーキテクチャと、重荷となるアーキテクチャの分かれ目となる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341624566

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business