Skip to Content
詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンス
book

詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンス

by Denny Lee, Tristen Wentling, Scott Haines, Prashanth Babu, 長谷川 亮, 倉光 怜, 小谷 尚太郎, 竹下 俊一郎
November 2025
Beginner to intermediate
388 pages
6h 8m
Japanese
O'Reilly Japan, Inc.
Content preview from 詳解 データレイクハウスアーキテクチャ ―Delta Lakeを使ったデータAI活用とガバナンス

8章高度な機能

この章では、他の章に比べて、Delta Lakeテーブルの操作や利用方法に直接関係する話題よりも、便利な一部の高度な機能に焦点を当てる。これらは特にメタデータに関係したものである。まず最初に、生成列(Generated Columns)をテーブル定義に含めることで、データの挿入や変換に必要な作業量を削減する方法を説明する。その後、Delta Lakeのメタデータを活用して、制約(Constraints)やコメントを通じてデータ品質を向上させ、ユーザにより豊富な情報を提供する方法を紹介する。最後に、削除ベクトル(Deletion Vectors)が適用可能なテーブルに対するさまざまな操作をどのようにスピードアップさせるかについて共有する。これらの各機能は、テーブルのメタデータとトランザクションログをうまく利用することで、Delta Lakeの性能がさらに強化されていることを示している。

8.1 生成列(Generated Columns)・キー・ID

Delta Lakeにおいて比較的使われていない機能の1つとして 、Spark内で生成列を利用して動的に列の値を作成する機能がある。簡単に言うと、生成列とはテーブル定義時に簡単な式を追加することによって、その列の値を動的に生成する機能である。これにより、新規データ挿入時に明示的に値を挿入する代わりに、定義された式に基づいて自動的に値が生成される。生成列の利用方法は多岐にわたり、シンプルなID列(Identity Columns)の自動生成から、入力された既存の列を用いてシンプルな変換処理を行った新規列を作成するなど、幅広い活用が可能である。

この章のすべての例とその他のコードは、この本のGitHubリポジトリ(https://oreil.ly/2m8Kv ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

実践 LLMアプリケーション開発 ―プロトタイプを脱却し、実用的な実装に迫るための包括的な手引き

実践 LLMアプリケーション開発 ―プロトタイプを脱却し、実用的な実装に迫るための包括的な手引き

Suhas Pai, 金本 勝吉, オライリー・ジャパン編集部
ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

Heidi Helfand, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 細澤 あゆみ

Publisher Resources

ISBN: 9784814401390Publisher Website