Chapitre 10. Spark SQL
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Spark SQL est sans doute l'une des fonctionnalités les plus importantes et les plus puissantes de Spark. Ce chapitre présente les concepts fondamentaux de Spark SQL que tu dois comprendre. Ce chapitre ne réécrira pas la spécification ANSI-SQL ni n'énumérera chaque type d'expression SQL. Si tu lis d'autres parties de ce livre, tu remarqueras que nous essayons d'inclure du code SQL partout où nous incluons du code DataFrame pour faciliter les références croisées avec les exemples de code. D'autres exemples sont disponibles dans l'annexe et dans les sections de référence.
En bref, avec Spark SQL, tu peux exécuter des requêtes SQL contre des vues ou des tables organisées en bases de données. Tu peux également utiliser des fonctions système ou définir des fonctions utilisateur et analyser les plans de requête afin d'optimiser leur charge de travail. Cela s'intègre directement à l'API DataFrame et Dataset, et comme nous l'avons vu dans les chapitres précédents, tu peux choisir d'exprimer certaines de tes manipulations de données en SQL et d'autres en DataFrames, et elles se compileront dans le même code sous-jacent.
Qu'est-ce que SQL ?
SQL ou Structured Query Language est un langage spécifique à un domaine permettant d'exprimer des opérations relationnelles sur des données. Il est utilisé dans toutes les bases de données relationnelles, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access