Chapitre 6. Algorithmes graphiques
Jusqu'à présent, nous nous sommes principalement concentrés sur les données d'enregistrement, qui sont généralement stockées dans des fichiers plats ou des bases de données relationnelles et peuvent être représentées sous la forme d'une matrice (un ensemble de lignes avec des colonnes nommées). Nous allons maintenant nous intéresser aux données basées sur des graphiques, qui décrivent les relations entre deux ou plusieurs points de données. Un exemple courant est celui des données de réseaux sociaux : par exemple, si "Alex" est un "ami" de "Jane" et que "Jane" est un "ami" de "Bob", ces relations forment un graphique. Les données sur les compagnies aériennes et les vols sont un autre exemple courant de données graphiques ; nous explorerons ces deux types de données (et d'autres) dans ce chapitre.
Les structures de données sont des moyens spécifiques d'organiser et de stocker des données dans les ordinateurs afin qu'elles puissent être utilisées efficacement. Outre les structures de données linéaires telles que celles avec lesquelles nous avons principalement travaillé dans les chapitres précédents (tableaux, listes, tuples, etc.), elles comprennent des structures non linéaires telles que les arbres, les cartes de hachage et les graphes.
Ce chapitre présente GraphFrames, un puissant package externe pour Spark qui fournit ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access