545
Kapitel 22
Ein Data Warehouse planen
Das Hauptziel eines Data Warehouse ist es, die Entscheidungsfindung im Unter-
nehmen zu unterstützen. Häufig dient es auch als Grundlage für das Berichtswe-
sen. Aus diesem Grund werden Data Warehouse- und Data Mart-Anwendungen
häufig auch als Decision Support-System (DSS) bezeichnet. Die Daten werden aus
anderen internen und externen Datenbanken und -quellen gesammelt und in der
Regel über nächtliche Ladeprozesse importiert und aufbereitet. In einem Data
Warehouse befinden sich also Unternehmensdaten, die bewusst redundant gehal-
ten werden.
Wozu wird ein Data Warehouse benötigt und wieso können die Daten nicht direkt
aus den operativen Systemen abgefragt werden? Prinzipiell ist das möglich, aller-
dings aus den folgenden Gründen nicht praktikabel:
쐽 Die Datenmodelle operativer Systeme sind aufgrund ihrer Struktur für DSS-
Abfragen nur begrenzt geeignet.
쐽 Die Informationen sind über mehrere Datenbanksysteme unterschiedlicher
Hersteller verteilt.
쐽 Der Anwender besitzt keine umfassenden Kenntnisse über die Bedeutung der
Daten und wie diese zu bewerten sind.
쐽 Die Aufbereitung der Daten ist komplex und technisch aufwendig.
쐽 Die Verwaltung der verteilten Zugriffsberechtigungen ist komplex und aufwen-
dig.
쐽 Aggregierte Tabellen stehen nur selten zur Verfügung.
쐽 DSS-Abfragen stören den Betrieb und verschlechtern die Performance der ope-
rativen Datenbanken.
쐽 Die Konfiguration einer Data Warehouse-Datenbank ist konträr zur Konfigura-
tion für den OLTP-Betrieb.
Eine der wichtigsten Herausforderungen für den Datenbankadministrator ist es,
eine gute Performance sowohl für die Ladeprozesse als auch für die DSS-Abfragen
und Berichte zur Verfügung zu stellen. Fast jede Entscheidung, die in einem Data
Warehouse-Projekt getroffen wird, muss das Thema Performance berücksichti-
gen. Die Ursache liegt in der Größe der Tabellen sowie der relationalen Nachbil-
dung eines mehrdimensionalen Modells. Zwar ist Performance in einem Data
Warehouse nicht alles, aber ohne gute Performance wird das Projekt scheitern.
Get Oracle 12c - Das umfassende Handbuch now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.