November 2025
Beginner to intermediate
388 pages
6h 8m
Japanese
Delta Lakeは、私がApache Spark、EC2、S3を使って大規模なストリーミングETLシステムを構築する際に直面した課題について、Michealと私が議論したことから生まれた。Apple社でも、サイバー攻撃の検知やセキュリティ対策のために膨大な量のデータを処理する際に、同じ課題に直面していた。我々は、ストリーミングによるデータの取り込みだけでなく、ストリーミングによるサイバー攻撃の検知も可能で、長いタイムフレームを保持している大規模データセットを高性能なクエリでサポートできるシステムを構築する必要があった。これらの要件から、Delta Lakeが生まれ、ACIDトランザクション、バッチ処理とストリーミング処理のシームレスな統合がサポートされ、日々発生するペタバイト級のデータを効率的に処理できるようになった。
本書は、Delta Lakeのアーキテクチャの基礎、実用的なアプリケーション、ベストプラクティスを紹介するものである。データエンジニア、サイエンティスト、ビジネスリーダーのいずれであっても、Delta Lakeを効果的に活用するための貴重な洞察を得ることができるだろう。
皆さんが本書を読み進め、Delta Lakeがどのようにあなた自身のイノベーションを推進できることを楽しみにしている。私たちはともに、データガバナンスの未来を形作り、信頼性が高く高性能なデータレイクハウスの構築を可能にしているのである。
——Dominique Brezinski、Distinguished Engineer、Apple、Delta Lake技術運営委員会メンバー
Read now
Unlock full access