Chapitre 3. Visite guidée de l'ensemble des outils de Spark
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Au chapitre 2, nous avons présenté les concepts fondamentaux de Spark, comme les transformations et les actions, dans le contexte des API structurées de Spark. Ces simples éléments conceptuels sont à la base du vaste écosystème d'outils et de bibliothèques d'Apache Spark(Figure 3-1). Spark est composé de ces primitives - les API de niveau inférieur et les API structurées - puis d'une série de bibliothèques standard pour des fonctionnalités supplémentaires.
Figure 3-1. L'ensemble des outils de Spark
Les bibliothèques de Spark prennent en charge un grand nombre de tâches différentes, de l'analyse des graphes et de l'apprentissage automatique à la diffusion en continu et aux intégrations avec une multitude de systèmes de calcul et de stockage. Ce chapitre présente une visite éclair d'une grande partie de ce que Spark a à offrir, y compris certaines des API que nous n'avons pas encore abordées et quelques-unes des principales bibliothèques. Pour chaque section, tu trouveras des informations plus détaillées dans d'autres parties de ce livre ; notre objectif ici est de te donner un aperçu de ce qui est possible.
Ce chapitre couvre les points suivants :
-
Exécuter des applications de production ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access