Kapitel 61. Sechs Dimensionen für die Auswahl eines analytischen Data Warehouse

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Gleb Mezhanskiy

Das Data Warehouse (DWH) spielt eine zentrale Rolle im Datenökosystem. Es ist auch oft der teuerste Teil der Dateninfrastruktur, der ersetzt werden muss. Deshalb ist es wichtig, die richtige Lösung zu wählen, die mindestens sieben Jahre lang gut funktionieren kann. Da Analysen für wichtige Geschäftsentscheidungen genutzt werden, ist die Wahl des falschen DWH ein sicherer Weg, um einen kostspieligen Engpass für dein Unternehmen zu schaffen.

In diesem Kapitel schlage ich sechs Dimensionen zur Bewertung einer Data-Warehousing-Lösung für die folgenden Anwendungsfälle vor:

  • Einlesen und Speichern aller analytischen Daten

  • Ausführen von Datentransformationen (das T von ELT)

  • Bereitstellung von Daten für die Verbraucher (für Dashboards und Ad-hoc-Analysen)

Skalierbarkeit

Unternehmen, die sich für schlecht skalierbare Data Warehouses entscheiden, zahlen einen enormen Produktivitätsverlust, wenn ihre DWHs nicht mehr wachsen können: Abfragen stauen sich, Nutzer werden blockiert und das Unternehmen ist gezwungen, auf ein besser skalierendes DWH zu migrieren. Doch wenn du den Schmerz spürst, ist es bereits zu spät: Die Migrationen sind langsam (Jahre), schmerzhaft ...

Get 97 Dinge, die jeder Dateningenieur wissen sollte now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.