Kapitel 1. Was verstehen wir unter datengesteuert?

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Ohne Daten bist du nur eine weitere Person mit einer Meinung.

William Edwards Deming

Bei der Datenorientierung geht es um die Entwicklung von Werkzeugen, Fähigkeiten und vor allem um eine Kultur, die auf der Grundlage von Daten handelt. In diesem Kapitel wird erläutert, was datengetriebene Organisationen auszeichnet. Ich beginne mit einigen Grundvoraussetzungen für die Datenerfassung und den Datenzugang. Dann stelle ich die Berichterstattung und Alarmierung den Analysen gegenüber, denn das ist ein wichtiger Unterschied. Es gibt viele verschiedene Arten von vorausschauenden Analysen, die unterschiedlich ausgefeilt sind. Daher nehme ich mir etwas Zeit, um diese Arten zu erläutern und sie mit den Begriffen "Analysestufen" und "Analysereife" zu beschreiben, wobei ich insbesondere auf die Merkmale einer analytisch ausgereiften Organisation eingehe. Wie sieht das aus?

Machen wir uns auf den Weg, um unsere erste Frage zu beantworten: Was bedeutet es für eine Organisation, datengesteuert zu sein?

Datenerhebung

Schaffen wir ein paar offensichtliche Voraussetzungen aus dem Weg.

Voraussetzung 1: Eine Organisation muss Daten sammeln.

Daten sind zweifelsohne ein wichtiger Bestandteil. Natürlich können es nicht irgendwelche Daten sein, sondern es müssen die richtigen Daten sein. Der Datensatz muss für die jeweilige Frage relevant sein. Außerdem müssen sie zeitnah, genau, sauber und unvoreingenommen sein, und was vielleicht am wichtigsten ist, sie müssen vertrauenswürdig sein.

Das ist eine große Aufgabe. Daten sind immer schmutziger, als du denkst. Es kann subtile, versteckte Verzerrungen geben, die deine Schlussfolgerungen beeinflussen können, und das Bereinigen und Aufbereiten von Daten kann ein schwieriges, zeitaufwändiges und teures Unterfangen sein. Ich höre oft, dass Datenwissenschaftler/innen 80 % ihrer Zeit damit verbringen, Daten zu beschaffen, zu bereinigen und aufzubereiten, und nur 20 % ihrer Zeit damit, Modelle zu erstellen, zu analysieren, zu visualisieren und Schlussfolgerungen aus diesen Daten zu ziehen (zum Beispiel http://bit.ly/nyt-janitor und http://bit.ly/im-data-sci). Meiner Erfahrung nach ist das durchaus plausibel. Im nächsten Kapitel gehe ich ausführlicher auf Aspekte der Datenqualität ein.

Selbst wenn du Qualitätsdaten hast, und selbst wenn du viele Qualitätsdaten hast, kommst du damit nicht sehr weit, und trotz des Hypes, den du vielleicht hörst, wirst du dadurch nicht datengesteuert. Manche Leute, vor allem bestimmte Big-Data-Anbieter und -Dienstleister, preisen Big Data als Allheilmittel an: Wenn du alles sammelst, befinden sich irgendwo darin Diamanten (oder goldene Nuggets oder Nadeln oder eine von vielen anderen Metaphern), die jedes Unternehmen erfolgreich machen werden. Die harte Wahrheit ist, dass Daten allein nicht ausreichen. Eine kleine Menge sauberer, vertrauenswürdiger Daten kann viel wertvoller sein als Petabytes an Datenmüll.

Datenzugang

Voraussetzung #2: Die Daten müssen zugänglich und abfragbar sein.

Genaue, zeitnahe und relevante Daten zu haben, reicht jedoch nicht aus, um als datengesteuert zu gelten. Sie müssen es auch sein:

Anschließbar

Die Daten müssen in einer Form vorliegen, die bei Bedarf mit anderen Unternehmensdaten verknüpft werden kann. Es gibt viele Möglichkeiten, z. B. relationale Datenbanken, NoSQL-Speicher oder Hadoop. Verwende das richtige Werkzeug für die Aufgabe. Die Finanzanalysten von Warby Parker haben zum Beispiel lange Zeit Excel benutzt, um die wichtigsten Kennzahlen zu berechnen, die sie der Geschäftsleitung vorlegen. Sie holten sich riesige Mengen an Rohdaten aus verschiedenen Quellen und führten VLOOKUPS (eine Excel-Funktion zum Auffinden von Querverweisen in den Daten) aus, um all diese Daten miteinander zu verbinden und einen Überblick über die Zahlen zu erhalten. Anfangs funktionierte das gut, aber als der Umsatz und der Kundenstamm des Unternehmens schnell wuchsen, wurden die Daten immer größer, die Excel-Datei wurde fast 300 MB groß, der Arbeitsspeicher der Computer war voll und die VLOOKUPS dauerten 10 Stunden oder länger, stürzten häufig ab und mussten neu gestartet werden. Sie hatten das Tool und den Ansatz so weit ausgereizt, wie es nur ging. Excel war ein geeignetes Werkzeug gewesen, aber das Hyperwachstum des Unternehmens änderte das. Das Ermitteln der Zahlen wurde für die Analysten zu einem riesigen Zeitfresser und zu einer Quelle von Stress, weil sie sich nicht sicher waren, ob sie ihre Zahlen bekommen würden oder ob sie weitere 10 Stunden warten mussten, um die VLOOKUPS erneut auszuführen. Dadurch wurden sie von Analysten zu Microsoft-Dateningenieuren. Mein Team half dabei, den gesamten Datensatz in eine relationale MySQL-Datenbank zu übertragen. Wir schrieben Abfragen, um die Zahlen für sie zu verarbeiten, so dass sie sich auf die Analyse, die Trends und die Präsentation der Daten konzentrieren konnten - eine viel bessere Nutzung ihrer Zeit. Jetzt, wo sie bessere Werkzeuge und mehr Zeit haben, können sie tiefere und reichhaltigere Analysen erstellen.

Teilbar

Es muss eine Kultur des Datenaustauschs innerhalb des Unternehmens geben, damit Daten zusammengeführt werden können, z. B. indem der Clickstream der Kunden mit ihrem Transaktionsverlauf kombiniert wird. Stell dir einen Patienten vor, der in die Notaufnahme eines Krankenhauses eingeliefert wird, dort behandelt wird und dann mit der Auflage entlassen wird, für weitere Behandlungen und Untersuchungen in eine Ambulanz zu gehen. Der Patient erhält einen schlechteren Kundenservice und vor allem eine schlechtere Versorgung, wenn das Krankenhaus und die Klinik keine Daten austauschen - wann, wo und warum er eingeliefert wurde, welche Probleme er hatte, welche Behandlung er erhielt usw. Aus Sicht der Gesundheitsdienstleister wird es für ihre Analysten schwer oder unmöglich sein, den Prozess und die Versorgung zu analysieren und zu verbessern, wenn sie kein kohärentes, genaues Bild der Patientenströme, der Diagnoseprozesse und der vollständigen Längsschnittdaten dieser Patienten haben. Silo-Daten werden also immer die Möglichkeiten einschränken, die man erreichen kann. Wenn mehr Daten für mehr Teile eines Systems verfügbar sind, ist das Ganze größer als die Summe der Teile.

Abfragbar

Es muss geeignete Werkzeuge geben, um die Daten abzufragen und aufzuschlüsseln und zu würfeln. Bei allen Berichten und Analysen müssen die Daten gefiltert, gruppiert und aggregiert werden, um die großen Mengen an Rohdaten in eine kleinere Menge an übergeordneten Zahlen zu reduzieren, die unserem Gehirn helfen zu verstehen, was in einem Unternehmen vor sich geht. Ich muss in der Lage sein, Trends zu erkennen oder Unterschiede zwischen den Kundensegmenten zu verstehen. Analysten müssen über Werkzeuge verfügen, mit denen sie diese Kennzahlen relativ einfach berechnen können.

(Alle diese Themen werden in späteren Kapiteln ausführlicher behandelt).

OK, jetzt haben wir also Daten und sie sind zugänglich. Ist das ausreichend? Nein, noch nicht. Du brauchst Menschen mit den richtigen Fähigkeiten, um diese Daten zu nutzen. Das kann die Mechanik des Filterns und Aggregierens von Daten bedeuten, z. B. durch eine Abfragesprache oder Excel-Makros, aber auch Menschen, die die geeigneten Kennzahlen zum Extrahieren und Verfolgen entwerfen und auswählen (dieses Thema wird in Kapitel 6 behandelt). Bei diesen Kennzahlen kann es sich um Wiederanmelderaten (für Abonnementdienste wie Netflix oder das Wall Street Journal), Lifetime-Werte oder Wachstumskennzahlen handeln, aber irgendjemand muss sie festlegen und irgendjemand muss einen Prozess entwickeln, um diese Werte bereitzustellen.

Damit ein Unternehmen datengesteuert arbeiten kann, muss es Menschen geben, die die richtigen Fragen an die Daten stellen, Menschen, die die richtigen Daten und Kennzahlen auslesen können, und Menschen, die diese Daten für die nächsten Schritte nutzen. Kurz gesagt: Daten allein werden dein Unternehmen nicht retten.

Melden

Nehmen wir an, du hast eine analytische Gruppe mit Zugang zu genauen Daten. Die Gruppe extrahiert Verkaufsdaten und erstellt einen Bericht, in dem sie stolz behauptet, dass die Buchungen des Unternehmens von April bis Mai um 5,2 % gestiegen sind(Abbildung 1-1).

Alt Text
Abbildung 1-1. 5,2 % Umsatzwachstum im Vergleich zum Vormonat!

Das hört sich jetzt sicherlich mehr nach einem datengesteuerten Unternehmen an. Aber das ist immer noch völlig unzureichend. Sicherlich ist es gut, dass sie diese Kennzahlen verfolgen. Der CFO und der CEO werden sicherlich an diesen Zahlen interessiert sein. Aber was sagt dir dieser Wert von 5,2 % wirklich? Sehr wenig, um genau zu sein. Es gibt viele mögliche Gründe, warum der Umsatz des Unternehmens um diesen Betrag gestiegen ist:

  • Angenommen, du verkaufst ein stark saisonabhängiges Produkt, wie z. B. Strandbekleidung. Vielleicht sind 5,2 % viel weniger als normal. Vielleicht liegt das Wachstum im Mai in den meisten Jahren mehr als 7 % über dem des Vormonats und in diesem Jahr liegt es weit unter dem Durchschnitt.
  • Vielleicht hat dein Marketingleiter viel Geld für eine nationale Kampagne ausgegeben, um die Markenbekanntheit zu steigern. Wie viel von dem Wachstum von 5,2 % wurde durch diese Kampagne erzielt und war diese Kampagne ihr Geld wert?
  • Vielleicht war dein CEO bei Good Morning America zu Gast, oder dein Produkt wurde in Techcrunch vorgestellt, oder ein Video ging viral, und das war der Auslöser. Das heißt, das Wachstum kann auf ein bestimmtes ungewöhnliches Ereignis zurückgeführt werden (das ein vorübergehendes oder anhaltendes Wachstum auslösen kann).
  • Vielleicht sind die monatlichen Umsätze gering und stark schwankend. Vielleicht war das Wachstum nur Glück und der allgemeine Trend ist rückläufig. (Wenn du jemals mit Aktien gehandelt hast, wirst du das sicher verstehen).
  • Vielleicht sind die Daten einfach falsch. Wenn deine Umsätze relativ stabil sind und du eine Spitze siehst und dir keine ungewöhnlichen Ereignisse bekannt sind, gibt es vielleicht ein Problem mit der Datenqualität.

All das sind Möglichkeiten. Die gemeldete Zahl ist genau das: ein Zahlenwert mit wenig bis gar keinem Kontext.

"Je größer und komplexer ein Unternehmen wird, desto weniger verlassen sich die Führungskräfte auf Erfahrungen aus erster Hand und desto mehr auf stark verarbeitete Daten. - John Gardner

John Maeda (@johnmaeda) August 16, 2014

Alerting

Ding, ding, ding! Der Web-App-Server Nr. 14 hat in den letzten fünf Minuten durchschnittlich mehr als 98 % CPU-Auslastung erreicht.

Alerts sind im Wesentlichen Berichte darüber, was gerade passiert. Sie liefern in der Regel sehr spezifische Daten mit gut gestalteten Metriken. Aber wie Berichte sagen sie dir nicht, warum die CPU-Auslastung in die Höhe geschnellt ist und was du jetzt tun musst, um das Problem zu beheben. Wie bei den Berichten fehlt auch hier der entscheidende Kontext. Es gibt keine kausale Erklärung. Das ist der Punkt, an dem Leistungstechniker/innen oder Systemadministrator/innen in die Produktionsprotokolle eintauchen, um herauszufinden, was los ist, warum es passiert und welche Möglichkeiten es gibt, das Problem zu beheben: Code zurücksetzen, weitere Server aufsetzen, den Load Balancer neu konfigurieren usw.

Abbildung 1-2 zeigt ein Beispiel für die Serverauslastung im Laufe der Zeit. Es gibt einige Schwankungen, aber den größten Teil des Tages verbringt man mit einer Warteschlange von etwa 0,5 oder weniger. Um 1 Uhr nachts steigt die Auslastung innerhalb von 30 Minuten auf mehr als 5, also auf das Zehnfache des "Normalen". Das scheint höchst ungewöhnlich. Was ist da los? Vielleicht sollte das jemand in Ordnung bringen, aber wie?

In diesem Fall sind es nur die wöchentlichen Backups, die laufen. Das passiert jeden Donnerstag um 1 Uhr nachts - ganz normal, hier gibt es nichts zu sehen. Das macht deutlich, dass es hier tolle Daten und eine gute Kennzahl gibt, die klar dargestellt wird. Aber es fehlt der Kontext - dass es durch Backups verursacht wird, dass es nach einem bestimmten Zeitplan passiert und dass dieses Zeitfenster um 1 Uhr nachts erwartet wird und dass der Server diese Last ohne Probleme bewältigen kann -, das alles fehlt.

Alt Text
Abbildung 1-2. Beispiel für die Serverauslastung im Laufe der Zeit (von http://bit.ly/bwf-back).

Von der Berichterstattung und Alarmierung zur Analyse

Berichterstattung und Alarmierung sind notwendige, aber nicht hinreichende Merkmale einer datengesteuerten Organisation. Wir sollten jedoch die Bedeutung dieser beiden Aktivitäten nicht unterschätzen. Vor allem das Berichtswesen ist eine äußerst wertvolle Komponente einer datengesteuerten Organisation. Ohne sie ist ein effektives Unternehmen nicht möglich. Das Gegenteil ist jedoch nicht der Fall: Es gibt viele Organisationen, die sich auf das Berichtswesen konzentrieren und wenig bis gar keine wirklichen (objektiven) Analysen durchführen. Zum einen kann es sein, dass die Berichterstattung durch gesetzliche Vorschriften und Verpflichtungen wie die Einhaltung des Sarbanes-Oxley-Gesetzes und die Erstellung von Gewinnberichten für die Aktionäre bestimmt wird und nicht durch eine interne Unternehmenskultur, die auf die Verbesserung des Unternehmens ausgerichtet ist.

Berichte sagen dir, was in der Vergangenheit passiert ist. Sie bietet auch eine Ausgangsbasis, von der aus Veränderungen und Trends beobachtet werden können. Das kann interessant sein und einige Investoren und Aktionäre glücklich machen, aber es ist eine grundsätzlich rückwärtsgewandte Sicht auf die Welt. Um datengesteuert zu sein, musst du darüber hinausgehen. Du musst zukunftsorientiert sein und Analysen durchführen, herausfinden, warum sich die Zahlen ändern, und gegebenenfalls überprüfbare Vorhersagen treffen oder Experimente durchführen, um weitere Daten zu sammeln, die Aufschluss über die Gründe geben.

Werden wir deutlicher und vergleichen wir die beiden. Hier ist ein Satz von Definitionen:

Melden

"Der Prozess der Organisation von Daten in informativen Zusammenfassungen, um zu überwachen, wie die verschiedenen Bereiche eines Unternehmens abschneiden.1

Analyse

"Daten in wettbewerbsfähige Erkenntnisse umwandeln, die mit Hilfe von Menschen, Prozessen und Technologien Geschäftsentscheidungen und -maßnahmen vorantreiben"2

In den Berichten steht, was passiert ist - wir haben am Donnerstag um 10:03 Uhr einen Spitzenwert von 63.000 gleichzeitigen Besuchern auf der Website erreicht.

Die Analyse sagt, warum es passiert ist - das Unternehmen wurde in einem Beitrag in der TV-Nachrichtensendung 60 Minutes um 10:01 Uhr erwähnt - und sollte Empfehlungen aussprechen, was das Unternehmen tun kann oder sollte, um mehr oder weniger davon zu erreichen.

Die Berichterstattung ist sachlich und beschreibend. Die Analyse hingegen ist präskriptiv.

In Tabelle 1-1 fassen wir die Unterschiede zwischen den beiden zusammen. Jetzt ist hoffentlich klar, warum Analyse und Datenorientierung eine so wichtige Facette oder kulturelle Komponente eines Unternehmens sind. Sie können ein Unternehmen in neue Richtungen oder zu größerer Effizienz führen.

Tabelle 1-1. Hauptmerkmale der Berichterstattung im Vergleich zur Analyse (größtenteils aus Dykes, 2010).
Melden Analyse
Beschreibend Vorgeschrieben
Was? Und warum?
Rückwärtsgewandt Vorausschauend
Fragen aufwerfen Fragen beantworten
Daten → Informationen Daten + Informationen → Erkenntnisse
Berichte, Dashboards, Warnungen Erkenntnisse, Empfehlungen, Vorhersagen
Kein Kontext Kontext + Storytelling

Ein nützlicher Rahmen für das Verständnis von Analytik ist Davenport et al.3 (siehe Tabelle 1-2).

Tabelle 1-2. Die von Davenport aufgestellten Hypothesen zu den wichtigsten Fragen, die durch Analytik beantwortet werden können (in Anlehnung an Davenport et al., 2010). D) ist eine wertvolle Analyse, aber nur E) und F) sind datengesteuert und auch nur dann, wenn auf die Informationen reagiert wird (weitere Erläuterungen im Text).
Vergangenheit Geschenk Zukunft
Informationen

A) Was ist passiert?

Melden

B) Was passiert jetzt?

Warnungen

C) Was wird passieren?

Extrapolation

Einsicht

D) Wie und warum ist es passiert?

Modellierung, Versuchsplanung

E) Was ist die nächstbeste Maßnahme?

Empfehlung

F) Was ist das Beste/Schlechteste, was passieren kann?

Vorhersage, Optimierung, Simulation

Hier sehen wir in der unteren Reihe Aktivitäten, die zu Erkenntnissen führen. Wie ich bereits erwähnt habe, sind Berichte (A) und Warnmeldungen (B) einfach nicht datengesteuert: Sie geben an, was in der Vergangenheit passiert ist oder dass etwas Ungewöhnliches oder Unerwünschtes jetzt passiert; es gibt keine Erklärung, warum es passiert oder warum es passiert ist, und keine Empfehlungen, wie man die Situation lösen oder reproduzieren kann. Die Suche nach den Ursachen durch Modelle oder Experimente (D) ist eine Vorstufe zur Datenorientierung. Nur wenn du verstehst, warum etwas passiert ist, kannst du einen Plan oder eine Reihe von Empfehlungen formulieren (E). E) und F) sind wirklich datengesteuert, aber nur, wenn die Informationen auch umgesetzt werden - was weiter unten ausführlich erklärt wird.

(C ist eine Gefahrenzone: Es kann einfach sein, einen wahrgenommenen Trend in die Zukunft zu verlängern - in Excel klickst du auf "Diagramm" und dann auf "Trendlinie hinzufügen" -, d.h. außerhalb des aktuellen Datenbereichs zu extrapolieren und eine naive Vorhersage zu treffen. Selbst wenn du eine vernünftige Wahl für die Funktionsform des Modells triffst, gibt es viele Gründe, warum diese Vorhersage irreführend oder schlichtweg falsch sein kann. Damit du dich auf deine Vorhersagen verlassen kannst, solltest du dich um ein kausales Modell bemühen. Die Arten der Analyse werden in Kapitel 5 behandelt).

Zusammenfassend lässt sich sagen, dass die untere Reihe zukunftsorientierte Aktivitäten hervorhebt, die Elemente der kausalen Erklärung beinhalten. Jetzt fangen wir an zu erörtern, was es bedeutet, datengesteuert zu sein.

Kennzeichen der Datenorientierung

Es gibt verschiedene Arten von Aktivitäten, die wirklich datengesteuerte Organisationen durchführen:

  • Ein datengesteuertes Unternehmen testet vielleicht ständig. Es könnte A/B-Tests auf einer Website durchführen oder E-Mail-Betreffzeilen in einer Marketingkampagne testen. LinkedIn führt zum Beispiel 200 Experimente pro Tag durch, während Etsy Dutzende von Experimenten gleichzeitig durchführt. Zu den Tests können auch Nutzertests gehören, bei denen direkt mit Kunden oder Nutzern gearbeitet wird, um direktes Feedback zu möglichen neuen Funktionen oder Produkten zu erhalten.
  • Ein datengesteuertes Unternehmen ist auf kontinuierliche Verbesserung bedacht. Es kann an der wiederholten Optimierung von Kernprozessen beteiligt sein, z. B. um die Fertigungszeiten um Minuten zu verkürzen oder die Kosten pro Akquisition zu senken. Dies geschieht durch sorgfältige Analysen, die Erstellung von mathematischen oder statistischen Modellen und Simulationen.
  • Ein datengesteuertes Unternehmen kann an der Vorhersage von Verkäufen, Aktienkursen oder Unternehmenseinnahmen beteiligt sein, aber vor allem die Vorhersagefehler und andere Erkenntnisse in die Modelle einfließen lassen, um sie zu verbessern (wir behandeln dies in Kapitel 10).
  • Ein datengesteuertes Unternehmen wird mit ziemlicher Sicherheit anhand einer Reihe von gewichteten Variablen zwischen zukünftigen Optionen oder Maßnahmen wählen. Die Ressourcen sind immer begrenzt, und es gibt immer Vor- und Nachteile für verschiedene sinnvolle Handlungsoptionen. Man sollte für jede der Variablen, die von Interesse sind, Daten sammeln und eine Gewichtung vornehmen, um eine endgültige Entscheidung zu treffen. Als Warby Parker zum Beispiel seinen ersten Bürostandort außerhalb von New York auswählte, berücksichtigte das Unternehmen eine große Anzahl von Variablen - Gallups Wohlfühlindex, Talentpool, Lebenshaltungskosten, Anzahl und Kosten der Flüge nach New York usw. - und gewichtete sie als Teil der endgültigen Entscheidung. Marissa Mayer (CEO von Yahoo!) erzählt eine ähnliche Geschichte, als sie zwischen konkurrierenden Jobangeboten wählte und sich für Google entschied .4

Ein echtes datengesteuertes Unternehmen wird mindestens eines dieser Dinge tun, etwas Zukunftsweisendes, bei dem Daten ein Bürger erster Klasse sind.

OK, jetzt haben wir eine Organisation, die über hochwertige Daten und qualifizierte Analysten verfügt, die sich mit diesen zukunftsorientierten Aktivitäten beschäftigen. Das macht sie sicherlich datengesteuert!

Leider nicht unbedingt. Wie ein Baum, der im Wald fällt, ohne dass es jemand hört, ist es nicht datengesteuert, wenn Analysten Analysen erstellen, aber niemand davon Notiz nimmt, wenn sie die Entscheidungen der Entscheidungsträger nicht beeinflussen, die immer noch auf Bauchgefühl und Meinung basieren. Analysen müssen die Entscheidungsträger informieren und beeinflussen.

Dykes spricht in diesem Zusammenhang von einer "analytischen Wertschöpfungskette" (siehe Abbildung 1-3). Daten müssen zu Berichten führen, die wiederum zu tieferen Analysen führen sollten. Diese Analysen müssen zu den Entscheidungsträgern gelangen, die sie in ihren Entscheidungsprozess einbeziehen. Dieser Schritt ist der Schlüssel zu datengesteuertem Handeln. Ein Unternehmen braucht diese Daten und Analysen, um eine Entscheidung zu treffen, die die Strategie oder Taktik ändert und sich in irgendeiner Weise auf das Unternehmen auswirkt. Technologie und Schulung können den ersten Teil übernehmen: Analysten in die Lage versetzen, Analysen durchzuführen und ihre Ergebnisse aufzuschreiben. Es ist jedoch die Kultur, die die Einstellung und den Prozess schafft, diese Ergebnisse zur Kenntnis zu nehmen, ihnen zu vertrauen und danach zu handeln.

Schließlich kommen wir zum Kern dessen, was datengesteuertes Handeln bedeutet. Ein datengesteuertes Unternehmen nutzt die Daten als wichtige Informationen, um die Strategie zu beeinflussen. Es gibt eine evidenzbasierte Kultur, in der den Daten vertraut werden kann und in der die Analyse höchst relevant und informativ ist und zur Festlegung der nächsten Schritte genutzt wird.

Genau darin liegt die Herausforderung. Wenn dein Unternehmen Entscheidungen aus dem Bauch heraus trifft, wie kannst du dann für eine stärker datengestützte Entscheidungsfindung werben? Es ist nicht einfach und geht nicht schnell, also erwarte keine radikalen Veränderungen über Nacht, aber jeder in einer Organisation kann einen wichtigen Beitrag zu einer solchen Verbesserung leisten. In diesem Buch werden wir eine Reihe von Möglichkeiten untersuchen, wie die Unternehmenskultur zu mehr datengesteuerten Entscheidungen geführt werden kann.

Alt Text
Abbildung 1-3. Die Wertschöpfungskette der Analytik (aus Dykes, 2010). In einer datengesteuerten Organisation liefern die Daten Berichte, die zu tiefergehenden Analysen anregen. Diese werden an die Entscheidungsträger weitergeleitet, die sie in ihren Entscheidungsprozess einbeziehen und so die Richtung beeinflussen, die das Unternehmen einschlägt, und einen Mehrwert und eine Wirkung erzielen. Abbildung aus http://bit.ly/dykes-reporting.

Analytik Reifegrad

Im Jahr 2009 erklärte Jim Davis, Senior Vice President und Chief Marketing Officer von SAS Institute, dass es acht Stufen der Analytik gibt:5

Standardberichte

Was ist passiert? Wann ist es passiert? Beispiel: monatliche Finanzberichte.

Ad-hoc-Berichte

Wie viele? Wie oft? Wo? Beispiel: benutzerdefinierte Berichte.

Abfrage-Drilldown (oder Online Analytical Processing, OLAP)

Wo genau liegt das Problem? Wie finde ich die Antworten? Beispiel: Datenermittlung über die Arten von Handynutzern und ihr Anrufverhalten.

Warnungen

Wann sollte ich reagieren? Welche Maßnahmen sind jetzt notwendig? Beispiel: Die bereits erwähnte CPU-Auslastung.

Statistische Analyse

Warum ist das so? Welche Möglichkeiten verpasse ich? Beispiel: Warum refinanzieren mehr Bankkunden ihre Häuser?

Vorhersage

Was ist, wenn dieser Trend anhält? Wie viel wird benötigt? Wann wird es gebraucht? Beispiel: Einzelhändler können die Nachfrage nach Produkten von Geschäft zu Geschäft vorhersagen.

Prädiktive Modellierung

Was wird als nächstes passieren? Wie wird sich das auf mein Geschäft auswirken? Beispiel: Kasinos sagen voraus, welche VIP-Kunden mehr Interesse an bestimmten Urlaubspaketen haben werden.

Optimierung

Wie können wir Dinge besser machen? Was ist die beste Entscheidung für ein komplexes Problem? Beispiel: Wie lässt sich die IT-Infrastruktur am besten optimieren, wenn mehrere widersprüchliche Geschäfts- und Ressourcenbeschränkungen vorliegen?

Diese Ideen scheinen die Grundlage für eine Abbildung in Davenport und Harris' einflussreichem Buch Competing on Analytics von 2007 zu sein,6 hier als Abbildung 1-4 dargestellt.

Alt Text
Abbildung 1-4. "Business Intelligence and Analytics" aus Davenport und Harris' Competing on Analytics. HBR Press, zuvor abgeleitet von Jim Davis' Ebenen der Analytik.

(Du kannst sehen, dass dies auch die Grundlage von Davenports Rahmen und Tabelle 1-2 ist. Du kannst die ersten vier Ebenen leicht der oberen Informationszeile und die zweite Gruppe von vier Ebenen der unteren Erkenntniszeile in Tabelle 1-2 zuordnen).

Mir gefallen das allgemeine Konzept und die Bezeichnungen. Die Art und Weise, wie sowohl Davis (2009) als auch Davenport und Harris (2007) ihre Ideen präsentieren, vor allem der große Pfeil nach oben, macht es jedoch zu einfach, dies als eine Progression oder eine Art Hierarchie zu interpretieren, ähnlich wie bei einem Videospiel, bei dem man das nächste Level erst erreicht, wenn man das vorherige Level erobert hat.

Diese Pseudo-Progression wird oft als "analytische Reife" bezeichnet. Wenn du eine Google-Suche nach "Analysereife" durchführst, wirst du sehen, was ich meine: Viele BI-Anbieter und -Anwender stellen dies als eine Reihe von Stufen dar, die mit einseitigen Pfeilen von einer Stufe zur nächsten führen. Analytik ist etwas anderes: Sie ist stufenübergreifend innerhalb einer Analyse, und verschiedene Teile des Unternehmens können gleichzeitig mit Analysen von unterschiedlichem Reifegrad beschäftigt sein. Ron Shevlin7 hat einige gute Argumente:

Aus der Perspektive der Fähigkeiten gibt es keinen Grund, warum ein Unternehmen nicht etwas wie den Umsatz prognostizieren könnte ("Ebene" 6), ohne genau zu wissen, wo das "Problem" beim Umsatz liegt ("Ebene" 3)... Wie könnte ich als Manager die Frage "Welche Maßnahmen sind jetzt erforderlich?" angehen, ohne zu wissen, "Was passiert, wenn diese Trends anhalten?" und "Was wird als Nächstes passieren?" ("Ebene" 6 und 7)?

Der richtige Weg, dies zu interpretieren, besteht meiner Meinung nach darin, sich vorzustellen, dass das maximale Niveau, auf dem sich ein Unternehmen engagiert, positiv mit dem Grad des Engagements, der Investition und dem Nutzen der Analytik korreliert und, wie Davenport und Harris argumentieren, die analytische Wettbewerbsfähigkeit. Wenn du zum Beispiel ein promoviertes Operations-Research-Team hast, das sich mit der Optimierung deiner globalen Lieferkette beschäftigt, hast du eindeutig viel in Daten und Analysen investiert. Wenn dein Unternehmen nur auf Warnmeldungen und Abfrage-Drilldowns zurückgreift, hast du weniger investiert und bist weniger datengetrieben.

Das impliziert, dass ausgefeiltere Analysen besser sind; sie machen ein Unternehmen wettbewerbsfähiger. Stimmt das? In einer faszinierenden Studie,8 MIT Sloan Management Review in Zusammenarbeit mit dem IBM Institute for Business Value eine Umfrage unter 3.000 Managern und Analysten in 30 Branchen zu ihrer Nutzung von und ihren Ansichten über den Wert von Analysen durchgeführt.

In einer Umfrage wurde nach der Wettbewerbsposition der Organisation gefragt, wobei die möglichen Antworten lauteten:

  1. Deutlich besser als die Branchenkollegen
  2. Etwas besser als die Branchenkollegen
  3. Auf Augenhöhe mit Branchenkollegen
  4. Etwas oder wesentlich schlechter als die Branchenkollegen

Die Organisationen, die Antwort 1 oder 4 wählten, wurden als Top-Performer bzw. Low-Performer bezeichnet. Interessanterweise waren die Top-Performer im Vergleich zu den Low-Performern:

  • Fünfmal wahrscheinlicher, dass sie Analytik nutzen
  • Dreimal wahrscheinlicher sind sie anspruchsvolle Analytik-Nutzer
  • Die Wahrscheinlichkeit, dass sie Analysen zur Steuerung des Tagesgeschäfts nutzen, ist doppelt so hoch
  • Die Wahrscheinlichkeit, dass sie Analysen nutzen, um zukünftige Strategien zu entwickeln, ist doppelt so hoch

Es gibt sicherlich komplizierende Faktoren in der Methodik. Es kann eine erhebliche Verzerrung durch Überlebende geben, und es gibt wahrscheinlich eine Korrelation zwischen den Top-Performern und der Unternehmensgröße (wir wissen, dass der Umsatz dieser Unternehmen zwischen weniger als 500 Millionen und mehr als 10 Milliarden US-Dollar lag). So haben vielleicht nur größere, erfolgreichere Unternehmen die Bandbreite und die Ressourcen, um ausgefeilte Operations-Research-Abteilungen aufzubauen, die Simulationsmodelle für die Lieferkette entwickeln und betreiben können. Es herrschte jedoch weitgehend Einigkeit darüber, dass bessere und ausgefeiltere Analysen den Geschäftswert steigern.

Die Autoren haben drei Stufen der Analysefähigkeit identifiziert: aspirational, experienced, and transformed. Diese sind in Tabelle 1-3 zusammengefasst.

Tabelle 1-3. Stufen der Analysefähigkeit: anstrebend, erfahren und verändert. Abgeändert von http://bit.ly/sloan-big-data.
Aufstrebend Erfahrene Verwandelt
Nutze Analysen, um... Handlungen rechtfertigen Leitfaden-Aktionen Aktionen vorschreiben
Strenge Ansätze zur Entscheidungsfindung verwenden Selten Manchmal Meistens
Die Fähigkeit, Informationen und Erkenntnisse zu erfassen, zusammenzufassen und zu analysieren oder zu teilen Begrenzt Mäßig Hoch
Funktionale Befähigung
  • Finanzen und Budgetierung
  • Betrieb und Produktion
  • Vertrieb und Marketing
  • Alle angestrebten Funktionen
  • Strategie / biz-dev
  • Kundenbetreuung
  • Produkt F&E
  • Alle aufstrebenden und erfahrenen Funktionen
  • Risikomanagement
  • Kundenerfahrung
  • Arbeitskräfteplanung
  • Allgemeines Management
  • Marken- und Marketingmanagement

Im Vergleich zu den aufstrebenden Organisationen waren die transformierten Organisationen:

  • Viermal wahrscheinlicher, dass sie Informationen sehr gut erfassen
  • Neunmal wahrscheinlicher, dass sie Informationen sehr gut zusammenfassen
  • Achtmal wahrscheinlicher, dass sie Informationen sehr gut analysieren können
  • Zehnmal wahrscheinlicher, dass sie Informationen und Erkenntnisse sehr gut verbreiten
  • 63% nutzen mit höherer Wahrscheinlichkeit eine zentralisierte Analyseeinheit als Hauptquelle für Analysen (Organisationsstrukturen für Analysen werden in Kapitel 4 behandelt)

Auch hier gibt es ein kompliziertes Geflecht von Ursachen und Wirkungen und Verzerrungen, aber es gibt einen Zusammenhang zwischen Wettbewerbsvorteilen im Vergleich zu anderen Unternehmen der Branche und der Ausgereiftheit von Analysen.

Was hält die Unternehmen also davon ab, Analytik auf breiter Front einzusetzen? Zwei der drei wichtigsten Antworten waren das mangelnde Verständnis für den Einsatz von Analytik und die fehlenden Fähigkeiten in den Geschäftsbereichen (siehe Abbildung 1-5).

Alt Text
Abbildung 1-5. Antworten auf die Frage: "Was sind die Haupthindernisse für eine breite Einführung und Nutzung von Informationen und Analysen in deinem Unternehmen?"

Das sind Dinge, die jeder, auch jeder Analyst, vorantreiben kann. Analysten können zum Beispiel ihre Fähigkeiten verbessern und proaktiver gute Arbeit leisten und ihren Vorgesetzten und dem Unternehmen ihren Wert vermitteln. Sie können mehr recherchieren, um Fallstudien darüber zu finden, wie andere Unternehmen ähnliche Geschäftsprobleme mithilfe von Analysen gelöst haben. Die Vorgesetzten der Dateningenieure können Ressourcen für die Datenintegration und -qualität bereitstellen, damit den Daten vertraut wird. Leitende Angestellte können eine stärkere gemeinsame Nutzung von Daten fördern oder fordern und die Verantwortung für die Daten klarer festlegen, z. B. durch die Ernennung eines Chief Analytics Officer oder Chief Data Officer (siehe Kapitel 11). Jeder hat eine Rolle zu spielen.

Übersicht

In den folgenden Kapiteln werden wir auf diese Fragen näher eingehen. Konkret untersuche ich die Anforderungen an die Grundlage: die rohen und aggregierten Daten selbst und ihre Qualität (Kapitel 2 und 3). Als Nächstes untersuche ich die Organisation der Analysten: welche Arten von Analysten es gibt, welche Fähigkeiten sie haben sollten und wie sie strukturiert sein sollten(Kapitel 4). Ich gehe auf Aspekte der Datenanalyse(Kapitel 5), die Entwicklung von Kennzahlen(Kapitel 6) und das Geschichtenerzählen mit Daten(Kapitel 7) ein. Kapitel 8 behandelt A/B-Tests. Ein wichtiger Punkt ist die Kultur und der Entscheidungsfindungsprozess, die ein gutes datengesteuertes Unternehmen auszeichnen (Kapitel 9 und 10). Ich erkläre, was für das Management der Kultur und das Veränderungsmanagement, insbesondere in größeren Organisationen, erforderlich ist: eine datengesteuerte Führungsebene. Dabei gehe ich insbesondere auf drei neue Führungspositionen ein: Chief Data Officer, Chief Digital Officer und Chief Analytics Officer(Kapitel 11). In Kapitel 12 geht es um ethische und datenschutzrechtliche Fragen und darum, wie ein Unternehmen, das die Daten seiner Nutzerinnen und Nutzer respektiert, die Möglichkeiten seiner Analytikerinnen und Analytiker, mit den Daten umzugehen, einschränken kann. Ich schließe mit einigen allgemeinen Schlussfolgerungen(Kapitel 13).

1 Dykes, B., "Berichterstattung vs. Analyse: Was ist der Unterschied?" Digital Marketing Blog, 19. Oktober 2010.

2 Faria, M., "Acting on Analytics: Wie man ein datengesteuertes Unternehmen aufbaut". BrightTALK, 11. September 2013.

3 Davenport, T. H., J. G. Harris, und R. Morison. Competing on Analytics. Boston: Harvard Business Press, 2010.

4 Bosker, B., "Google Exec Marissa Mayer erklärt, warum es nicht mehr weibliche Geeks gibt". The Huffington Post, 6. Juli 2011.

5 SAS, "Eight Levels of Analytics", (Cary, NC: SAS Institute, Inc., 2008), 4.

6 Obwohl die Quelle von Davenport und Harris zwei Jahre zuvor erschienen ist, wird sie als "angepasst an eine Grafik der SAS" zitiert.

7 Shevlin, R., "The Eight Levels of Analytics?" The Financial Brand, 27. Oktober 2009.

8 LaValle, S., M. S. Hopkins, E. Lesser, R. Shockley, N. Kruschwitz, "Analytics: Der neue Weg zur Wertschöpfung". MIT Sloan Management Review, 24. Oktober 2010.

Get Schaffung einer datengesteuerten Organisation now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.