Chapitre 9. Modèles classiques de conception de données
Ce chapitre aborde certains des schémas de conception de données les plus fondamentaux et les plus classiques utilisés dans la grande majorité des solutions big data. Même s'il s'agit de schémas de conception simples, ils sont utiles pour résoudre de nombreux problèmes de données courants, et j'ai utilisé beaucoup d'entre eux dans les exemples de ce livre. Dans ce chapitre, je présenterai les implémentations PySpark des modèles de conception suivants :
-
Entrée-Carte-Sortie
-
Entrée-Filtre-Sortie
-
Entrée-Carte-Réduction-Sortie
-
Entrée-Multiples-Cartes-Réduire-Sortie
-
Carte d'entrée-Combineur-Réduire-Sortie
-
Entrée-MapPartitions-Réduire-Sortie
-
Modèle d'entrée-index inversé-sortie
Mais avant de commencer, j'aimerais aborder la question de ce que j'entends par "modèles de conception". En informatique et en génie logiciel, étant donné un problème courant, un modèle de conception est une solution réutilisable à ce problème. Il s'agit d'un modèle ou d'une meilleure pratique pour résoudre un problème, et non d'une conception finie qui peut être transformée directement en code. Les modèles présentés dans ce chapitre te permettront de gérer un large éventail de tâches d'analyse de données.
Note ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access