Chapitre 3. L'architecture d'Apache Flink
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Le chapitre 2 a abordé les concepts importants du traitement des flux distribués, tels que la parallélisation, le temps et l'état. Dans ce chapitre, nous présentons l'architecture de Flink et décrivons la façon dont Flink aborde les aspects du traitement des flux que nous avons abordés précédemment. En particulier, nous expliquons l'architecture distribuée de Flink, nous montrons comment il gère le temps et l'état dans les applications de streaming et nous discutons de ses mécanismes de tolérance aux pannes. Ce chapitre fournit des informations de base pertinentes pour réussir à mettre en œuvre et à exploiter des applications de streaming avancées avec Apache Flink. Il t'aidera à comprendre les éléments internes de Flink et à raisonner sur les performances et le comportement des applications de streaming.
Architecture du système
Flink est un système distribué pour le traitement de flux de données parallèles avec état. Une configuration Flink se compose de plusieurs processus qui s'exécutent généralement de manière distribuée sur plusieurs machines. Les défis courants que les systèmes distribués doivent relever sont l'allocation et la gestion des ressources informatiques dans un cluster, la coordination des processus, le stockage durable et hautement disponible des données, et la reprise sur panne.
Flink ne ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access