November 2025
Beginner to intermediate
388 pages
6h 8m
Japanese
この章では、データ管理のニーズにDelta Lakeを使用する上で不可欠な操作について紹介する。Delta Lakeはストレージレイヤとして機能し、データアプリケーションのインタラクションレイヤに位置付けられるため、永続ストレージシステムの基本的な操作から始めることが理解しやすいだろう。Delta LakeがすでにACID保証を提供していることは説明済み†1だが、CRUD操作(図3-1参照)に焦点を当てることで、「Delta Lakeをどのように使うのか?」という問いに短時間でたどり着くことができる†2。しかし、これだけ知っていればよいというのであれば、非常に短い話(そして結果としてこの本も短い本になってしまう)になってしまうので、Delta Lakeのテーブルと対話するために不可欠ないくつかの追加事項、MERGE操作、いわゆるバニラParquetファイルからの変換、そしてテーブルメタデータについて見ていくことにする。
[†1] ACIDトランザクションについては1章で説明している。
[†2] さまざまなアプローチや異なるタイプのアプリケーションの比較については、WikipediaのCRUD操作の記事(https://ja.wikipedia.org/wiki/CRUD)から始めよう。
![]() |
|
特に指定がない限り、本書においてSQLとは、Spark SQL構文(https://oreil.ly/NXS90)を意味する。もしTrinoや他のSQLエンジンを使用してDelta ... |
Read now
Unlock full access