Pourquoi Spark pour l'analyse des données ?L'écosystème SparkArchitecture SparkLa puissance de PySparkArchitecture de PySparkAbstractions de données SparkExemples de RDDOpérations Spark RDDExemples de DataFrameUtilisation du shell PySparkLancement du shell PySparkCréer un RDD à partir d'une collectionAgrégation et fusion des valeurs des clésFiltrer les éléments d'un RDDRegrouper les touches similairesAgrégation de valeurs pour des clés similairesExemple ETL avec DataFramesExtractionTransformationChargementRésumé