
ge aus dem Datenpool (Subsample) wird für Testzwecke und aus Gründen gerin-
ger Zugriffszeiten ausgewählt. Die Daten werden einander angepasst (Transfor-
mation), um inhaltlichen (Dateityp, Feldlänge etc.) oder das Analyseprogramm
betreffenden Anforderungen zu genügen. Die für die Analyse adäquatesten Para-
meter werden ausgewählt (Parameter selection). Anschließend beginnt der ei-
gentliche Data mining-Prozess, der als Ergebnistypen die genannten Muster und
Ursache-Wirkungszusammenhänge transparent macht (Data analysis). Mit der
Interpretation und Visualisierung der Ergebnisse wird der Prozess abgeschlos-
sen, es sei denn, die Ergebnisse sind nicht ...