Skip to Content
Apache Flinkによるストリーム処理
book

Apache Flinkによるストリーム処理

by Fabian Hueske, Vasiliki Kalavri
March 2025
Intermediate to advanced
310 pages
5h 10m
Japanese
O'Reilly Media, Inc.
Content preview from Apache Flinkによるストリーム処理

第8章. 外部システムからの読み取りと外部システムへの書き込み

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

データ 、ファイルシステム、オブジェクトストア、リレーショナルデータベースシステム、キーバリューストア、検索インデックス、イベントログ、メッセージキューなど、さまざまなシステムに格納することができる。各クラスのシステムは、特定のアクセスパターンを想定して設計されており、特定の目的を果たすことに長けている。その結果、今日のデータインフラは多くの異なるストレージシステムで構成されていることが多い。新しいコンポーネントをミックスに加える前に、論理的な質問として、"スタック内の他のコンポーネントとどの程度うまく機能するか?"を問うべきである。

Apache Flinkのようなデータ処理システムを追加するには、慎重な検討が必要だ。なぜなら、Flinkは独自のストレージレイヤーを持たず、データの取り込みと永続化を外部ストレージシステムに依存しているからだ。したがって、Flinkのようなデータ処理システムにとって重要なのは、外部システムからデータを読み込んだり、外部システムにデータを書き込んだりするためのコネクタや、カスタムコネクタを実装するためのAPIを備えたライブラリを提供することである。しかし、外部データストアにデータを読み書きできるだけでは、障害発生時に意味のある一貫性保証を提供したいストリーム・プロセッサにとっては十分ではない。

この章では、ソースコネクタとシンクコネクタが Flink ストリーミングアプリケーションの一貫性保証にどのような影響を与えるかを説明し、データの読み取りと書き込みのための Flink の最も一般的なコネクタを紹介する。カスタムのソースコネクタとシンクコネクタを実装する方法と、外部データストアに非同期で読み取りまたは書き込み要求を送信する関数を実装する方法を学ぶ。

アプリケーションの一貫性保証

チェックポイント、セーブポイント、ステート・リカバリ" で、 を学んだ。Flink のチェックポイントとリカバリのメカニズムは、アプリケーションの状態の一貫したチェックポイントを定期的に取る。障害が発生した場合、アプリケーションの状態は完了した最新のチェックポイントから復元され、処理は続行される。しかし、アプリケーションの状態を一貫性のある点にリセットできるだけでは、アプリケーションの処理保証を満足させるには不十分である。その代わりに、アプリケーションのソース・コネクタとシンク・コネクタは、Flinkのチェックポイントとリカバリ・メカニズムと統合され、意味のある保証を与えることができるように、特定のプロパティを提供する必要がある。

、アプリケーションに1回きりの状態一貫性を提供する、1アプリケーションの各ソース・コネクタは、その読み取り位置を以前にチェックポイントした位置にセットできる必要がある。チェックポイントを行う際、ソース演算子はその読み取り位置を永続化し、リカバリ時にこれらの位置を復元する。読み取り位置のチェックポイントをサポートするソース・コネクタの例としては、読み取りオフセッ トをファイルのバイト・ストリームに格納するファイル・ベースのソースや、読み取りオフセットを消費するトピッ ク・パーティションに格納する Kafka ソースがある。読み取り位置をストアおよびリセットできないソース・コネクタからアプリケーション がデータを取り込むと、障害が発生した場合にデータ損失が発生し、at-most-once ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

LLMのプロンプトエンジニアリング ―GitHub Copilotを生んだ開発者が教える生成AIアプリケーション開発

LLMのプロンプトエンジニアリング ―GitHub Copilotを生んだ開発者が教える生成AIアプリケーション開発

John Berryman, Albert Ziegler, 服部 佑樹, 佐藤 直生
信頼性の高い機械学習 ―SRE原則を活用したMLOps

信頼性の高い機械学習 ―SRE原則を活用したMLOps

Cathy Chen, Niall Richard Murphy, Kranti Parisa, D. Sculley, Todd Underwood, 井伊 篤彦, 張 凡, 樋口 千洋
AWS クックブック

AWS クックブック

John Culkin, Mike Zazon

Publisher Resources

ISBN: 9798341625044