Skip to Content
Datenalgorithmen mit Spark
book

Datenalgorithmen mit Spark

by Mahmoud Parsian
September 2024
Intermediate to advanced
438 pages
10h 26m
German
O'Reilly Media, Inc.
Book available
Content preview from Datenalgorithmen mit Spark

Kapitel 9. Klassische Datenentwurfsmuster

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel werden einige der grundlegendsten und klassischsten Datenentwurfsmuster besprochen, die in der überwiegenden Mehrheit der Big-Data-Lösungen verwendet werden. Auch wenn es sich um einfache Entwurfsmuster handelt, sind sie bei der Lösung vieler gängiger Datenprobleme nützlich, und ich habe viele von ihnen in den Beispielen in diesem Buch verwendet. In diesem Kapitel werde ich die PySpark-Implementierungen der folgenden Entwurfsmuster vorstellen:

  1. Input-Map-Output

  2. Input-Filter-Output

  3. Input-Map-Reduce-Output

  4. Input-Multiple-Maps-Reduce-Output

  5. Input-Map-Combiner-Reduce-Output

  6. Input-MapPartitions-Reduce-Output

  7. Input-Inverted-Index-Pattern-Output

Bevor wir jedoch beginnen, möchte ich die Frage klären, was ich mit "Entwurfsmuster" meine. In der Informatik und Softwareentwicklung ist ein Entwurfsmuster eine wiederverwendbare Lösung für ein häufig auftretendes Problem. Es ist eine Vorlage oder bewährte Methode für die Lösung eines Problems, kein fertiges Design, das direkt in Code umgewandelt werden kann. Mit den in diesem Kapitel vorgestellten Mustern kannst du eine breite Palette von Datenanalyseaufgaben bewältigen.

Hinweis

Die in diesem Kapitel besprochenen Datenentwurfsmuster ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Verteilte Systeme mit Kubernetes entwerfen

Verteilte Systeme mit Kubernetes entwerfen

Brendan Burns

Publisher Resources

ISBN: 9781098192037Supplemental Content