book

データエンジニアリングの設計パターン

by Bartosz Konieczny

April 2025

Beginner to intermediate

374 pages

5h 49m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

本書で使用されている慣例本書の構成本書の使い方本書を読み進める前に知っておくべきことは何か？用語集とコード例オライリー・オンライン・ラーニング問い合わせ先謝辞
デザインパターンとは何か？さらにデザインパターン？一般的なデータエンジニアリングパターン本書で使用したケーススタディ概要
フルロードパターンフルローダーインクリメント負荷パターンインクリメントローダーパターンデータキャプチャを変更するレプリケーションパターンパススルー・レプリケーターパターントランスフォーメーション・リプリケーターデータ圧縮パターンコンパクターデータの準備パターンレディネス・マーカーイベント・ドリブンパターン：外部トリガー概要
処理不能な記録パターンデッドレター重複記録パターン窓付きデュプリケーター後期データパターン後期データ検出器パターンスタティック・レイト・データ・インテグレーターパターンダイナミック・レイト・データ・インテグレーターフィルタリングパターンフィルターインターセプターフォールト・トレランスパターンチェックポインター概要
上書きパターン高速メタデータクリーナーパターンデータの上書き更新情報パターン合併パターンステートフル・マージャーデータベースパターンキー付きべき乗パターントランザクション・ライター不変性データセットパターンプロキシ概要
データの充実パターンスタティック・ジョイナーパターンダイナミック・ジョイナーデータデコレーションパターンラッパーパターンメタデータ・デコレーターデータ集約パターン分散アグリゲーターパターンローカル・アグリゲーターセッション化パターンインクリメント・セッショナイザーパターン：ステートフルセッショナイザーデータの注文パターンビンパックオーダーパターンFIFOオーダラー概要
シーケンスパターンローカル・シーケンサーパターンアイソレーテッド・シーケンサーファンインパターン：整列ファンインパターン：アンアライン・ファンインファンアウトパターン：パラレルスプリットパターンエクスクルーシブ・チョイスオーケストレーションパターンシングルランナーパターンコンカレント・ランナー概要
データ削除パターンバーチカル・パーティショナーパターンインプレイス・オーバーライターアクセス・コントロールパターン：テーブルのきめ細かいアクセッサーパターン：リソースのきめ細かいアクセッサーデータ保護パターン暗号機パターンアノニマイザーパターン疑似匿名化コネクティビティパターンシークレット・ポインターパターンシークレットレス・コネクター概要
パーティショニングパターン水平パーティショナーパターンバーチカル・パーティショナー記録組織パターンバケットパターンソーター読み取り性能の最適化パターンメタデータ・エンハンサーパターンデータセット・マテリアライザーパターンマニフェストデータ表現パターンノーマライザーパターンデノーマライザー概要
品質執行パターン監査-執筆-監査-出版パターンコンストレインツ・エンフォーサースキーマの一貫性パターンスキーマ互換性エンフォーサーパターンスキーマ・マイグレーター品質観察パターンオフライン・オブザーバーパターンオンラインオブザーバー概要

データ検出器パターンフロー中断検出器パターンスキュー検出器時間検出器パターンラグ検出器パターンSLAミス検出器データの系譜パターンデータセットトラッカーパターンファイングレイントラッカー概要
データ・インジェスト・デザイン・パターンエラー管理のデザインパターンべき等デザインパターンデータバリューのデザインパターンデータフローデザインパターンデータセキュリティのデザインパターンデータストレージのデザインパターンデータ品質デザインパターンデータ可観測性デザインパターン

Content preview from データエンジニアリングの設計パターン

あとがき

データエンジニアリングの領域は、過去数十年の間に進化してきた。それ以前は、データシステムはプロプライエタリなデータウェアハウスの上に構築され、データエンジニアリングは多くの場合、別のプロプライエタリなデータオーケストレーターのシェルスクリプトからSQLクエリをオーケストレーションすることに限られていた。

Hadoopの採用以来、世界は変わった。Hive、Pig、Storm、MapReduceといった過去のモダンなデータスタックは、データエンジニアに新たなコーディングスキルを求めた。次にクラウド革命が起こり、データインフラを理解し管理するための新たなスキルセットが要求された。今日、我々は次世代のデータ・プラットフォームをよりインテリジェントにし、非技術系ユーザでもシンプルなデータ・アクセスを可能にするジェネレーティブAI革命の一翼を担っている。

このような絶え間ない進化にもかかわらず、よく設計されたデータエンジニアリングシステムは、本書でデータエンジニアリングデザインパターンとして紹介するいくつかの普遍的かつ本質的な構成要素に基づくものであり、これからもそうであると私は信じている。

確かに、今日のSQLやPythonワークロードは、他のクエリやプログラミング言語に取って代わられるかもしれない。Apache Spark、テーブルファイル形式、そして本書で例としてよく使われるApache Kafka互換ブローカーは、次世代のデータプラットフォームの第一級市民ではなくなるかもしれない。しかし、それらがもう存在しないとしても、データシステムを構築する方法はそれほど劇的に変わることはないはずだ。データを継続的に、あるいはあまり定期的に取り込む方法は常に必要だ。生データをユーザにとって価値のあるものにする方法は常に必要だ。そして最後に、実装しデプロイしたものすべてが正しく機能していることを確認する方法が常に必要となる。

本書で取り上げるデータエンジニアリング・デザインパターンは、変化する技術世界においてこの安定性ファクターを提供してくれるはずだ。私と一緒に時間を過ごしてくれてありがとう。そして、データ工学の内臓についてもっと詳しく議論するために、実社会であなたに会えることを期待している！

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341640931Supplemental Content

データエンジニアリングの設計パターン

by Bartosz Konieczny

あとがき

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

FastAPIで生成型AIサービスを作る

データガバナンス定義ガイド

システム思考を学ぶ

AI支援プログラミング

Publisher Resources

あとがき

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

FastAPIで生成型AIサービスを作る

データガバナンス定義ガイド

システム思考を学ぶ

AI支援プログラミング

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.