Overview
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Apprends à utiliser, déployer et maintenir Apache Spark grâce à ce guide complet, écrit par les créateurs du framework open-source de calcul en grappes. En mettant l'accent sur les améliorations et les nouvelles fonctionnalités de Spark 2.0, les auteurs Bill Chambers et Matei Zaharia répartissent les sujets relatifs à Spark en sections distinctes, chacune ayant des objectifs uniques.
Tu exploreras les opérations de base et les fonctions communes des API structurées de Spark, ainsi que Structured Streaming, une nouvelle API de haut niveau permettant de créer des applications de streaming de bout en bout. Les développeurs et les administrateurs système apprendront les principes fondamentaux de la surveillance, du réglage et du débogage de Spark, et exploreront les techniques d'apprentissage automatique et les scénarios d'utilisation de MLlib, la bibliothèque d'apprentissage automatique évolutive de Spark.
- Un aperçu en douceur des big data et de Spark
- Apprends à connaître DataFrames, SQL et Datasets - les API de base de Spark - à l'aide d'exemples pratiques.
- Plonger dans les API de bas niveau de Spark, les RDD et l'exécution de SQL et de DataFrames.
- Comprendre comment Spark fonctionne sur un cluster
- Déboguer, surveiller et régler les clusters et les applications Spark.
- Apprendre la puissance de Structured Streaming, le moteur de traitement de flux de Spark.
- Apprends comment tu peux appliquer MLlib à une variété de problèmes, y compris la classification ou la recommandation.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access