Kapitel 8. Parallele Pipelines

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In den vorangegangenen Kapiteln haben wir uns mit Befehlen und Pipelines beschäftigt, die eine ganze Aufgabe auf einmal erledigen. In der Praxis kann es jedoch vorkommen, dass du mit einer Aufgabe konfrontiert wirst, bei der ein und derselbe Befehl oder dieselbe Pipeline mehrmals ausgeführt werden muss. Du musst zum Beispiel

  • Hunderte von Webseiten scrapen

  • Dutzende von API-Aufrufen durchführen und ihre Ausgabe umwandeln

  • Trainiere einen Klassifikator für eine Reihe von Parameterwerten

  • Erstelle Streudiagramme für jedes Merkmalspaar in deinem Datensatz

In jedem dieser Beispiele ist eine gewisse Form der Wiederholung enthalten. In deiner bevorzugten Skript- oder Programmiersprache könntest du dies mit einer for Schleife oder einer while Schleife erledigen. In der Kommandozeile würdest du vielleicht als erstes die Pfeiltaste nach oben drücken, um den vorherigen Befehl aufzurufen, ihn gegebenenfalls zu ändern und die Eingabetaste zu drücken, um den Befehl erneut auszuführen. Das ist in Ordnung, wenn du es zwei- oder dreimal machst, aber stell dir vor, du machst es Dutzende Male. Ein solches Vorgehen wird schnell umständlich, ineffizient und fehleranfällig. Die gute Nachricht ist, dass du solche Schleifen auch in der Kommandozeile schreiben kannst. Darum geht es in diesem Kapitel.

Manchmal reicht es aus, einen schnellen ...

Get Datenwissenschaft an der Kommandozeile, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.