Kapitel 17. Einsatz von Spark

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Dieses Kapitel von befasst sich mit der Infrastruktur, die du und dein Team für den Betrieb von Spark-Anwendungen benötigen:

  • Optionen für den Cluster-Einsatz

  • Die verschiedenen Cluster-Manager von Spark

  • Überlegungen zum Einsatz und zur Konfiguration von Einsätzen

Für sollte der größte Teil von Spark mit allen unterstützten Clustermanagern ähnlich funktionieren; um die Einrichtung anzupassen, musst du jedoch die Feinheiten der einzelnen Clustermanagementsysteme verstehen. Der schwierige Teil ist die Entscheidung für einen Clustermanager (oder die Wahl eines Managed Service). Obwohl wir gerne alle Details darüber aufführen würden, wie du verschiedene Cluster mit verschiedenen Clustermanagern konfigurieren kannst, ist es in diesem Buch einfach unmöglich, für jede Situation in jeder einzelnen Umgebung hyperspezifische Details zu liefern. Ziel dieses Kapitels ist es daher nicht, jeden einzelnen Clustermanager im Detail zu besprechen, sondern ihre grundlegenden Unterschiede zu beleuchten und eine Referenz für viele der Materialien zu bieten, die bereits auf der Spark-Website verfügbar sind. Leider gibt es keine einfache Antwort auf die Frage, welcher Clustermanager am einfachsten zu betreiben ist, da dies je nach Anwendungsfall, Erfahrung und Ressourcen sehr unterschiedlich ist. Auf der Spark-Dokumentationsseite findest ...

Get Spark: Der endgültige Leitfaden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.