Préface
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Bienvenue dans cette première édition de Spark : Le guide définitif! Nous sommes ravis de te présenter la ressource la plus complète sur Apache Spark aujourd'hui, en nous concentrant tout particulièrement sur la nouvelle génération d'API Spark introduite dans Spark 2.0.
Apache Spark est actuellement l'un des systèmes les plus populaires pour le traitement des données à grande échelle, avec des API dans plusieurs langages de programmation et une multitude de bibliothèques intégrées et tierces. Bien que le projet existe depuis de multiples années - d'abord en tant que projet de recherche lancé à l'UC Berkeley en 2009, puis à l'Apache Software Foundation depuis 2013 - la communauté open source continue de construire des API plus puissantes et des bibliothèques de haut niveau sur Spark, il y a donc encore beaucoup de choses à écrire sur le projet. Nous avons décidé d'écrire ce livre pour deux raisons. Premièrement, nous voulions présenter le livre le plus complet sur Apache Spark, couvrant tous les cas d'utilisation fondamentaux avec des exemples faciles à exécuter. Deuxièmement, nous voulions surtout explorer les API "structurées" de plus haut niveau qui ont été finalisées dans Apache Spark 2.0 - à savoir DataFrames, Datasets, Spark SQL et Structured Streaming - que les livres plus anciens sur Spark n'incluent pas toujours. Nous espérons que ce ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access