Chapitre 18. Surveillance et débogage
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Ce chapitre couvre les principaux détails dont tu as besoin pour surveiller et déboguer tes applications Spark. Pour ce faire, nous allons parcourir l'interface utilisateur de Spark avec un exemple de requête conçu pour t'aider à comprendre comment tracer tes propres jobs à travers le cycle de vie de l'exécution. L'exemple que nous allons examiner t'aidera également à comprendre comment déboguer tes jobs et où les erreurs sont susceptibles de se produire.
Le paysage de la surveillance
À un moment donné, tu auras besoin de surveiller tes travaux Spark pour comprendre où se situent les problèmes qu'ils rencontrent. Cela vaut la peine de passer en revue les différentes choses que nous pouvons réellement surveiller et d'exposer certaines des options permettant de le faire. Passons en revue les composants que nous pouvons surveiller (voir Figure 18-1).
- Applications et emplois Spark
-
La première chose que tu voudras commencer à surveiller, que ce soit pour déboguer ou simplement pour mieux comprendre comment ton application s'exécute par rapport au cluster, c'est l'interface utilisateur de Spark et les journaux de Spark. Ceux-ci rapportent des informations sur les applications en cours d'exécution au niveau des concepts de Spark, tels que les RDD et les plans de requête. Nous parlons en détail de l'utilisation de ces ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access