O'Reilly logo

Data Warehouse Technologien by Saake, Sattler, Köppen

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

6.2.2 Partitionierung in Data Warehouses
Welche Rolle spielt die Partitionierung in DW-Systemen? DW-Systeme verwal-
ten sehr große Datenmengen, sodass eine Aufteilung der Daten auf physisch
oder logisch verteilte Ressourcen naheliegend ist.
Besonders groß sind dabei die Faktentabellen, sodass sich hier eine Parti-
tionierung anbietet. Eine horizontale Partitionierung (insbesondere eine Range-
Partitionierung) erlaubt es, große Faktentabellen in handlichere Teile zu zer-
legen. Die Selektionsbedingungen für die einzelnen Partitionen sollten dabei
sinnvollerweise die in Anfragen häufig vorkommenden Bereichseinschränkun-
gen berücksichtigen.
Eine vertikale Partitionierung einer Faktentabelle ist überhaupt nur bei
mehreren Kennzahlen möglich, da in jeder Partition der Schlüssel enthalten
sein muss (also die Referenzen auf die Dimensionstabellen). Da der Schlüs-
sel mehrere Dimensionstabellenschlüssel umfasst, würde eine vertikale Auf-
teilung wenig Speichereinsparung bedeuten und könnte nur aus organisatori-
schen Gründen sinnvoll sein.
Eine vertikale Partitionierung erfordert zudem eine teure Join-Operation
zum Wiederzusammensetzen der Tupel, kann aber zum Abspalten selten ange-
fragter Kennzahlen eingesetzt werden.
Allerdings können auch Dimensionstabellen sehr groß werden, sodass man
dort neben einer horizontalen auch über vertikale Partitionierung nachdenken
sollte. Die vertikale Partitionierung von Dimensionstabellen wird sogar mit ei-
nem eigenen Begriff versehen: die sogenannten Mini-Dimensionen.
Mini-Dimensionen
Gelegentlich werden Dimensionstabellen riesig groß [LKS11a]. So kann bei-
spielsweise eine Kundentabelle durchaus mehrere Millionen Datensätze auf-
weisen. Gleichzeitig werden möglicherweise viele Attribute nie oder nur selten
angefragt, da sie für Auswertungen uninteressant sind. Oft existieren auch dis-
junkte Attributgruppen, die immer nur für verschiedene Anwendungen bezie-
hungsweise verschiedene Arten von Auswertungen benötigt werden.
Hier bietet sich eine Abtrennung von Attributen durch vertikale Partitio-
nierung an. Dieser Spezialfall vertikaler Partitionierung wird dann als das Ab-
spalten von Mini-Dimensionen bezeichnet und erlaubt dann eine deutliche Ver-
kleinerung der einzelnen Dimensionstabellen, vergleiche auch [LKS11b].
Abbildung 6.11 verdeutlicht am Beispiel der Kundentabelle das Prinzip der
Mini-Dimensionen. Die Demographie-Daten werden nur in bestimmten Anfra-
gen (Kampagnenplanung) benötigt, und in der Regel anonymisiert. So trennt
man sie sinnvollerweise von den Attributen Name und Vorname.
170 6 Speicherung

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, interactive tutorials, and more.

Start Free Trial

No credit card required