Kapitel 6. Strategien für die Softwareentwicklung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Ein der grundlegenden Konzepte in The Pragmatic Programmer von David Thomas und Andrew Hunt (Addison-Wesley) ist, dass Code leicht zu ändern sein sollte,1 ein Konzept, auf das ich im Laufe dieses Kapitels näher eingehen werde. Ich finde, dass dieser Ratschlag besonders wichtig ist, wenn du mit Datenpipelines arbeitest, bei denen Änderungen zum Alltag gehören. Bei der Entwicklung von Datenpipelines musst du Änderungen in einer Vielzahl von Bereichen unterstützen: Datengröße, -format und -form, Datenerfassung und -speicherung, sich ändernde Anforderungen an die Datenumwandlung und -validierung sowie Änderungen bei Cloud-Diensten, Providern und Datenverarbeitungsmaschinen.

Mit all diesen Vektoren für Änderungen können selbst die bestgemeinten Codebasen zu Spaghetti werden, was es schwierig macht, Funktionen zu ändern, zu erweitern und zu testen. Das wiederum wirkt sich negativ auf Leistung, Zuverlässigkeit und Kosten aus, da mehr Zeit und Ressourcen für die Fehlersuche und Weiterentwicklung der Pipeline benötigt werden.

In diesem Kapitel geht es darum, dir zu helfen, Codebasen zu entwerfen, die den wechselnden Anforderungen an das Design von Datenpipelines standhalten, wobei der Schwerpunkt auf der Entwicklung von ETC-Code liegt.

Zu Beginn werde ich einige gängige Codierungsumgebungen besprechen, die ...

Get Kosteneffiziente Datenpipelines now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.