Préface
Nous te souhaitons la bienvenue dans la deuxième édition de Learning Spark. Cinq ans se sont écoulés depuis la première édition publiée en 2015, dont l'auteur initial était Holden Karau, Andy Konwinski, Patrick Wendell et Matei Zaharia. Cette nouvelle édition a été mise à jour pour refléter l'évolution d'Apache Spark à travers Spark 2.x et Spark 3.0, y compris son écosystème élargi de sources de données intégrées et externes, l'apprentissage automatique et les technologies de streaming avec lesquelles Spark est étroitement intégré.
Au fil des années, depuis sa première version 1.x, Spark est devenu de facto le moteur de traitement unifié des big data. En cours de route, il a étendu son champ d'application pour inclure la prise en charge de diverses charges de travail analytiques. Notre intention est de capturer et de conserver cette évolution pour les lecteurs, en montrant non seulement comment tu peux utiliser Spark, mais aussi comment il s'inscrit dans la nouvelle ère du big data et de l'apprentissage automatique. C'est pourquoi nous avons conçu chaque chapitre de manière à ce qu'il s'appuie progressivement sur les bases posées par les chapitres précédents, en veillant à ce que le contenu soit adapté au public auquel nous nous adressons.
À qui s'adresse ce livre
La plupart des développeurs qui s'attaquent au big data sont des ingénieurs ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access