Avant-propos
Apache Spark a considérablement évolué depuis que j'ai lancé le projet à l'UC Berkeley en 2009. Après être passé à l'Apache Software Foundation, le projet open source a compté plus de 1 400 contributeurs issus de centaines d'entreprises, et le groupe mondial de meetup Spark s 'est agrandi pour atteindre plus d'un demi-million de membres. La base d'utilisateurs de Spark est également devenue très diversifiée, englobant des développeurs Python, R, SQL et JVM, avec des cas d'utilisation allant de la science des données à la veille stratégique en passant par l'ingénierie des données. J'ai travaillé en étroite collaboration avec la communauté Apache Spark pour l'aider à poursuivre son développement, et je suis ravi de voir les progrès réalisés jusqu'à présent.
La sortie de Spark 3.0 marque une étape importante pour le projet et a fait naître le besoin d'une mise à jour du matériel d'apprentissage. L'idée d'une deuxième édition d'Apprendre Spark a été évoquée à de nombreuses reprises - et elle se faisait attendre. Même si j'ai coécrit Learning Spark et Spark : The Definitive Guide (tous deux chez O'Reilly), il était temps pour moi de laisser la prochaine génération de contributeurs Spark reprendre le récit. Je suis ravi que quatre praticiens et développeurs expérimentés, qui travaillent en étroite collaboration avec Apache Spark depuis ses débuts, se soient associés pour rédiger cette deuxième édition du livre, en intégrant les API les plus récentes et les meilleures pratiques ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access