Kapitel 8. Null-ETL oder Fast-Zero-ETL

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 7 haben wir neue hybride Datenbanken vorgestellt, die alternative Lösungen zur Unterstützung von Echtzeitanalysen bieten. Diese Systeme reduzieren die Infrastruktur und machen Daten für analytische Workloads besser zugänglich. Da hybride Systeme traditionell verteilte Systeme zusammenführen, liegt die Vermutung nahe, dass hybride Systeme zu einem monolithischen System tendieren. Monolithische Systeme sind in der Regel dafür bekannt, dass es ihnen an Modularität und Skalierbarkeit bei der Ausführung von Datenarbeitslasten mangelt.

Ironischerweise führt das Aufbrechen eines monolithischen Datensystems dazu, dass wir eine Datenbank wieder zerlegen und von innen nach außen drehen, um die einzelnen Komponenten gezielt zu skalieren. Das ist nicht unbedingt eine negative Lösung. In diesem Buch schlagen wir vor, diese Systeme wieder in die Datenbank zu integrieren, um die Komplexität und die Kosten zu reduzieren, die traditionell mit großen verteilten Systemen verbunden sind.

ETL ist die Art und Weise, wie wir Daten von System zu System bewegen und sie dabei umwandeln. Bisher haben wir eine Form von ETL verwendet, die Streaming SQL genannt wird. In diesem Kapitel werden wir uns mit der Frage beschäftigen, wie wir bei der Implementierung von ETL ein Gleichgewicht zwischen Komplexität und Skalierbarkeit herstellen ...

Get Streaming-Datenbanken now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.