Kapitel 1. Geschäftswert mit KI schaffen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel werden wir untersuchen, warum der Einsatz von KI im Bereich Business Intelligence (BI) wichtiger denn je ist und wie KI von BI-Teams genutzt werden kann. Zu diesem Zweck werden wir die typischen Bereiche identifizieren, in denen KI BI-Aufgaben und -Prozesse unterstützen kann, und wir werden uns die zugrunde liegenden Fähigkeiten des maschinellen Lernens (ML) ansehen. Am Ende des Kapitels stellen wir ein praktisches Framework vor, mit dem du KI/ML-Fähigkeiten auf BI-Problembereiche abbilden kannst.

Wie KI die BI-Landschaft verändert

den letzten 30 Jahren hat sich BI langsam aber stetig zur treibenden Kraft hinter datengesteuerten Unternehmenskulturen entwickelt - zumindest bis sich die Aufmerksamkeit auf Data Science, ML und AI verlagerte. Wie kam es überhaupt dazu? Und was bedeutet das für deine BI-Organisation?

Wenn wir auf die Anfänge der ersten Ära von Entscheidungsunterstützungssystemen in den 1970er Jahren zurückblicken, sehen wir technische Systeme, die von IT-Experten eingesetzt wurden, um Erkenntnisse aus kleinen (für heutige Verhältnisse) Datensätzen zu gewinnen. Diese Systeme entwickelten sich weiter und wurden schließlich in den späten 1980er Jahren als BI bekannt. Die Analyse von Daten war neu, und selbst die grundlegendsten Erkenntnisse schienen verblüffend. Plötzlich basierten Entscheidungen nicht mehr auf dem Bauchgefühl, sondern auf tatsächlichen Daten, die sicherere und mutigere Entscheidungen in komplexen Geschäftsszenarien ermöglichten.

Die zweite BI-Ära begann Mitte der 2000er Jahre und wurde von Self-Service-Analysen dominiert. Eine Fülle neuer Tools und Technologien machte es für technisch nicht versierte Menschen einfacher denn je, Daten zu analysieren, zu visualisieren und Erkenntnisse aus immer größeren Datenquellen zu gewinnen. Diese wurden vor allem von großen Softwareanbietern wie Oracle, SAP und Microsoft angeboten, trieben aber auch das Wachstum von Nischenanbietern wie Tableau Software an. Auch Tabellenkalkulationssoftware wurde zunehmend in das gesamte Ökosystem der Datenanalyse integriert, z. B. indem Geschäftsanwender/innen über Pivot-Tabellen in Microsoft Excel auf online analytical processing (OLAP) Cubes auf einem Microsoft SQL Server-System zugreifen können.

Die meisten großen Unternehmen stecken heute noch in dieser zweiten Phase von BI fest. Warum ist das so? Erstens haben sich viele technologische Anstrengungen in den letzten Jahren darauf konzentriert, das exponentielle Wachstum der zugrundeliegenden Daten, die die BI-Systeme verarbeiten und aus denen sie Erkenntnisse ableiten sollen, technisch zu bewältigen. Zweitens hat die Zunahme der Datenmenge, die vor allem durch das Wachstum des Internets und der digitalen Dienste angetrieben wurde (siehe Abbildung 1-1), zu einem zunehmenden Mangel an datenkundigen Mitarbeitern geführt, die im Umgang mit hochdimensionalen Datensätzen und den entsprechenden Tools (in diesem Fall nicht Excel) geübt sind.

Data growth in recent years (source: Statista)
Abbildung 1-1. Datenwachstum in den letzten Jahren. Quelle: Statista

Im Vergleich zum Verbrauchermarkt sind KI-Anwendungen im professionellen BI-Bereich noch immer unterversorgt. Das liegt wahrscheinlich daran, dass KI- und BI-Talente in verschiedenen Teams in den Unternehmen sitzen, und wenn sie jemals aufeinander treffen, haben sie es schwer, effektiv miteinander zu kommunizieren. Das liegt vor allem daran, dass beide Teams in der Regel unterschiedliche Sprachen sprechen und unterschiedliche Prioritäten haben: BI-Experten sprechen in der Regel nicht viel über das Trainieren und Testen von Daten, und Data Scientists unterhalten sich selten über SQL Server Integration Services (SSIS)-Pakete und ETL-Routinen (Extrahieren, Transformieren, Laden).

Der Bedarf für den Einsatz von KI in der BI wird jedoch unweigerlich zunehmen, und zwar aufgrund der folgenden aktuellen Trends:

Das Bedürfnis, schnelle Antworten aus Daten zu erhalten
Um wettbewerbsfähig zu bleiben und zu wachsen, brauchen Unternehmen datengestützte Erkenntnisse. Datenanalysten werden mit Anfragen überhäuft, diese oder jene Kennzahl zu erforschen oder diesen oder jenen Datensatz zu untersuchen. Gleichzeitig steigt das Bedürfnis der Geschäftsanwender/innen, schnell und einfach Antworten aus den Daten zu erhalten. Wenn sie Google oder Amazon Alexa nach dem aktuellen Aktienkurs eines bestimmten Unternehmens fragen können, warum können sie dann nicht ihr professionelles BI-System nach den Umsatzzahlen von gestern fragen?
Demokratisierung von Erkenntnissen
Geschäftsanwender haben sich daran gewöhnt, mit Self-Service-BI-Lösungen Erkenntnisse aus Daten zu gewinnen. Die Daten von heute sind jedoch oft zu groß und zu komplex, um sie für reine Self-Service-Analysen an das Unternehmen weiterzugeben. Aufgrund der zunehmenden Datenmenge, -vielfalt und -geschwindigkeit ist es für technisch nicht versierte Nutzer/innen heute schwierig, wenn nicht sogar unmöglich, Daten mit vertrauten Tools auf ihren lokalen Computern zu analysieren. Um die Erkenntnisse im gesamten Unternehmen zu demokratisieren, werden BI-Systeme benötigt, die einfach zu bedienen sind und den Endnutzern automatisch Erkenntnisse liefern.
Zugänglichkeit von ML-Diensten
Während Einsatz von KI in Unternehmen weiter zunimmt, steigt auch die Erwartung an bessere Prognosen oder Vorhersagen. Dies gilt umso mehr für BI; Low-Code- oder No-Code-Plattformen machen es einfacher als je zuvor, ML-Technologien auch für Nicht-Datenwissenschaftler/innen zugänglich zu machen und setzen die Mitglieder des BI-Teams unter Druck, prädiktive Erkenntnisse in ihre Berichte einzubauen. Es ist zu erwarten, dass die gleichen Fortschritte in der Datenwissenschaft früher oder später auch im Bereich der BI stattfinden werden.

Um ein besseres Verständnis dafür zu vermitteln, wie BI-Teams KI nutzen können, schauen wir uns kurz das von Gartner veröffentlichte analytical insights model an(Abbildung 1-2).

Die Kernfunktion jeder BI- oder Berichtsinfrastruktur besteht darin, Rückblicke und Erkenntnisse zu liefern, indem deskriptive und diagnostische Analysen historischer Daten verwendet werden. Diese beiden Methoden sind für alle weiteren Analyseverfahren, die darauf aufbauen, von entscheidender Bedeutung.

Zunächst muss eine Organisation verstehen, was in der Vergangenheit passiert ist und was diese Ereignisse aus der Datenperspektive angetrieben hat. Dies wird in der Regel als grundlegende Berichterstattung mit einigen Einblicksfunktionen bezeichnet. Die technischen Schwierigkeiten und die Komplexität sind vergleichsweise gering, aber der Wert dieser Informationen ist es auch. Versteh mich nicht falsch: Ein zuverlässiges und strukturiertes Berichtswesen ist nach wie vor das wichtigste Rückgrat der Datenanalyse in Unternehmen, da es die Grundlage für fortgeschrittenere Konzepte bildet und Fragen oder Probleme auslöst, die zu weiteren Analysen führen. Tatsächlich schließt jede Stufe des Erkenntnismodells alle vorherigen Stufen mit ein. Predictive Analytics ist erst möglich, wenn du deine historischen Daten auswertest.

Types of insights and analytic methodologies
Abbildung 1-2. Arten von Erkenntnissen und Analysemethoden. Quelle: Gartner

Betrachte das folgende Beispiel. Ein Telekommunikationsunternehmen hat Kunden, die monatlich einen Dienst abonnieren. Jeden Monat wird eine bestimmte Anzahl von Kunden ihren Vertrag nicht verlängern und aus der Geschäftsbeziehung aussteigen - ein Phänomen, das als customer churn bezeichnet wird.

Die grundlegendste Anforderung an ein BI-System wäre es, zu verstehen, wie viele Kunden in der Vergangenheit abgewandert sind und wie sich diese Abwanderung im Laufe der Zeit entwickelt hat. Deskriptive Analysen würden uns die nötigen Informationen liefern, um herauszufinden, wie hoch die Abwanderungsrate im Laufe der Zeit ist und ob wir tatsächlich ein Problem haben. Tabelle 1-1 zeigt ein Beispiel dafür, wie das aussehen könnte.

Tabelle 1-1. Abwanderungsrate im Zeitverlauf (deskriptive Analyse)
Q1 Q2
Monat Januar 22 Februar 22 22. März 22. April 22. Mai Juni 22
Abwanderungsrate 24% 26% 22% 29% 35% 33%

Der eigentliche Wert dieser Informationen ist eher gering. Auf dieser Ebene kann die Analyse nicht wirklich sagen, warum das beobachtete Phänomen aufgetreten ist oder was man dagegen tun kann. Aber sie gibt zumindest Hinweise darauf, ob wir überhaupt ein Problem haben: Aus der Tabelle können wir ersehen, dass die Abwanderungsrate in Q2 deutlich höher ist als in Q1, es könnte sich also lohnen, dies noch genauer zu untersuchen.

Hier kommt die diagnostische Analyse ins Spiel. Wir können nun tiefer graben und die transaktionalen Verkaufsdaten mit mehr Informationen über die Kunden anreichern - zum Beispiel mit Altersgruppen, wie in Tabelle 1-2 gezeigt.

Tabelle 1-2. Abwanderungsrate über die Zeit und die Kundensegmente
Alter des Kunden Fluktuationsrate Q1 Fluktuationsrate Q2
18-29 29% 41%
30-49 28% 30%
50-64 24% 25%
65 und älter 20% 19%

Aus dieser Analyse geht hervor, dass die Abwanderungsraten bei Kunden, die 50 Jahre und älter sind, stabil zu bleiben scheinen. Auf der anderen Seite scheinen jüngere Kunden eher zu kündigen, und dieser Trend hat sich im zweiten Quartal verstärkt. Mit klassischen BI-Systemen können wir diese Daten anhand vieler Variablen analysieren, um herauszufinden, was vor sich geht.

In vielen Fällen ist ein Unternehmen in der Lage, allein durch diese Art von Analysen wertvolle Muster zu finden, die zu manuellen Maßnahmen oder Entscheidungen führen. Deshalb ist diese Phase immer noch so wichtig und wird es auch immer bleiben.

Predictive Analytics geht bei der Analyse einen Schritt weiter und beantwortet eine einzige Frage: Was wird in der Zukunft passieren, wenn sich alle Muster, die wir aus der Vergangenheit kennen, wiederholen? Daher fügt Predictive Analytics den Daten eine weitere Ebene von Wert und Komplexität hinzu, wie du in Tabelle 1-3 sehen kannst.

Tabelle 1-3. Schätzung der Kundenabwanderungswahrscheinlichkeit (prädiktive Analytik)
Kunden-ID Alter Plan Preis Monate aktiv Abwanderungswahrscheinlichkeit
12345 24 A $9.95 13 87%
12346 23 B $19.95 1 95%
12347 45 B $19.95 54 30%

Wenn wir den Bereich der historischen Daten verlassen, wird es noch komplexer. Anstatt Erkenntnisse in Form von wahr oder falsch zu liefern, geben wir nun Wahrscheinlichkeiten für das Eintreten bestimmter Ereignisse an (Abwanderungswahrscheinlichkeit). Gleichzeitig schaffen wir einen Mehrwert, weil wir alles, was wir aus der Vergangenheit wissen, in Annahmen darüber einfließen lassen, wie es das zukünftige Verhalten beeinflussen wird.

Zum Beispiel können wir auf der Grundlage der zukünftigen Abwanderungswahrscheinlichkeit und der historischen Umsatzdaten ein prognostiziertes Umsatzrisiko für das Unternehmen in den kommenden Quartalen berechnen, das in unsere Finanzplanung einfließt. Oder wir können Kunden mit einer hohen Abwanderungswahrscheinlichkeit auswählen, um gezielte Maßnahmen zur Minderung des Abwanderungsrisikos zu ergreifen.

Aber welche Maßnahmen sollten wir ergreifen? Willkommen bei prescriptive analytics! Tabelle 1-4 zeigt, wie das in der Praxis aussehen könnte. In diesem Fall fügen wir eine weitere Dimension hinzu, das nächstbeste Angebot, das je nach individuellem Profil und historischem Kaufverhalten des Kunden eine empfohlene Aktion wie einen bestimmten Rabatt oder ein Produkt-Upgrade enthält.

Tabelle 1-4. Vorschlagen von Maßnahmen (präskriptive Analytik)
Kunden-ID Alter Plan Preis Verstrichene Monate Abwanderungswahrscheinlichkeit Nächstbestes Angebot
12345 24 A $9.95 13 87% Jahresvertragsangebot
12346 23 B $19.95 1 95% Upgrade
12347 45 B $19.95 54 30% Keine

Wenn wir uns Organisationen mit Tausenden oder mehr Kunden ansehen, wird klar, dass wir uns zur Optimierung dieser Aufgaben aus der Makro-Perspektive auf die Automatisierung auf Mikroebene verlassen müssen. Es ist einfach unmöglich, all diese Minientscheidungen manuell zu treffen und die Wirksamkeit unserer Maßnahmen für jeden Kunden zu überwachen. Der Return on Investment (ROI) dieser Minientscheidungen ist einfach zu gering, um den manuellen Aufwand zu rechtfertigen.

Und genau hier passen KI und BI perfekt zusammen. Stell dir vor, dass KI die Abwanderungswahrscheinlichkeit zusammen mit einem Vorschlag für die nächstbeste Aktion für jeden Kunden anzeigen kann. Diese Informationen können wir nun mit klassischen BI-Kennzahlen wie den historischen Umsätzen oder der Loyalität des Kunden kombinieren und so eine fundierte Entscheidung über die Maßnahmen treffen, die den größten Einfluss auf das Geschäft haben und die besten Erfolgsaussichten bieten.

Die Beziehung zwischen KI und BI lässt sich daher gut in der folgenden Formel zusammenfassen:

  • Künstliche Intelligenz + Business Intelligence = Entscheidungsintelligenz

Die effektivste KI-gestützte BI-Anwendung ist eine, die automatisierte und menschliche Entscheidungsfindung miteinander verbindet. Das werden wir in Teil 2 praktisch erkunden. Werfen wir nun einen konkreten Blick darauf, wie KI uns systematisch helfen kann, unsere BI zu verbessern.

Häufige KI-Einsatzfälle für BI

KI kann den Wert von BI in der Regel auf drei Arten erhöhen:

  • Erkenntnisse automatisieren und den Analyseprozess benutzerfreundlicher gestalten

  • Bessere Prognosen und Vorhersagen berechnen

  • BI-Systeme befähigen, auch aus unstrukturierten Datenquellen Erkenntnisse zu gewinnen

Abbildung 1-3 gibt einen Überblick über die Zuordnung dieser Anwendungsbereiche zu den verschiedenen Analysemethoden.

How AI capabilities support analytical methods
Abbildung 1-3. Wie KI-Fähigkeiten analytische Methoden unterstützen

Schauen wir uns diese Bereiche etwas genauer an.

Automatisierung und Benutzerfreundlichkeit

Wenn, das BI-Tool selbst, intelligenter und benutzerfreundlicher wird, wird es auch für nicht-technische Benutzer zugänglicher, was die Arbeitsbelastung der Analysten verringert. Diese Benutzerfreundlichkeit wird in der Regel durch Automatisierung unter der Haube erreicht.

Intelligente Algorithmen ermöglichen es, Berge von Daten in Sekundenschnelle zu durchforsten und Geschäftsanwendern oder Analysten interessante Muster oder Erkenntnisse zu liefern. Wie Abbildung 1-4 zeigt, eignen sich diese Routinen besonders gut für die deskriptiven und diagnostischen Analysephasen.

KI kann dabei helfen, interessante Korrelationen oder ungewöhnliche Beobachtungen zwischen vielen Variablen zu entdecken, die Menschen sonst vielleicht übersehen würden. In vielen Fällen ist KI auch besser in der Lage, Kombinationen von Messgrößen zu betrachten als Menschen, die sich jeweils auf eine einzelne Messgröße konzentrieren können. Automatisierung und Benutzerfreundlichkeit berühren aber auch die Phase der prädiktiven Analyse, indem sie es den Nutzern zum Beispiel noch einfacher machen, eigene ML-Modelle zu trainieren und einzusetzen.

AI-powered BI: automation and ease of use (application layer)
Abbildung 1-4. KI-gestützte BI: Automatisierung und Benutzerfreundlichkeit (Anwendungsebene)

Dabei ist eine wichtige Sache zu beachten: Die KI-Fähigkeiten in diesem Stadium sind in der Regel in die Anwendungsschicht integriert, also in deine BI-Software. Du kannst diese Funktionen also in der Regel nicht mit ein paar Zeilen Python-Code zu einer BI-Plattform hinzufügen (im Gegensatz zu KI-gestützten Vorhersagen und der Erschließung unstrukturierter Daten, die wir in den Kapiteln 7, 8 und 9 behandeln). Wenn du moderne BI-Plattformen wie Microsoft Power BI oder Tableau verwendest, wirst du diese KI-gestützten Funktionen in diesen Tools finden. Manchmal sind sie versteckt oder gehen so nahtlos ineinander über, dass du gar nicht merkst, dass hier KI im Spiel ist.

Der Rest dieses Abschnitts beschreibt Indikatoren dafür, dass KI unter der Haube arbeitet, um dein Leben als Analyst zu erleichtern.

Natürliche Sprachverarbeitung zur Interaktion mit Daten nutzen

Durch den Einsatz von KI-gestützten Technologien zur Verarbeitung natürlicher Sprache (NLP) sind Maschinen viel besser in der Lage, Texteingaben von Nutzern zu interpretieren und zu verarbeiten. Angenommen, du möchtest die Umsatzzahlen des letzten Monats oder die Umsätze in den USA im letzten Jahr im Vergleich zu diesem Jahr wissen. Du könntest die folgenden Abfragen eintippen:

How were my sales in Texas in the last 5 years?

oder

Sales $ in Texas last year vs Sales $ in Texas this year

Es wird kein komplizierter Code oder eine Abfragesprache benötigt. Diese Ebene der Q&A-ähnlichen Eingabe macht BI für technisch nicht versierte Nutzer/innen viel zugänglicher und bequemer für Analytiker/innen, die nicht jede Frage vorhersehen können, die ein/e Nutzer/in mit einem vorgefertigten Bericht stellen könnte. Die meisten Nutzer/innen werden mit diesem Ansatz vertraut sein, denn er ähnelt der Nutzung einer Suchmaschine wie Google.

Unabhängig davon, ob Q&A-Tools in dein BI-Tool integriert sind oder nicht, funktionieren nicht alle diese Implementierungen gleich gut. Tatsächlich muss hinter den Kulissen eine große Komplexität gelöst werden, damit diese Funktionen in Produktionsumgebungen zuverlässig funktionieren. Analysten müssen die Art der Fragen, die Geschäftsanwender stellen, verfolgen und überprüfen, ob die generierten Ergebnisse korrekt sind. Synonyme und fachspezifische Ausdrücke müssen definiert werden, damit die Systeme die Eingabeaufforderungen richtig interpretieren können. Und wie bei allen IT-Systemen müssen auch diese Dinge ständig gewartet werden. Die Hoffnung ist, dass sich die Systeme verbessern und der manuelle Aufwand im Hintergrund mit der Zeit abnimmt.

Zusammenfassen der Analyseergebnisse

Auch wenn ein Diagramm selbsterklärend zu sein scheint, ist es gute Praxis, die wichtigsten Erkenntnisse in ein oder zwei Zeilen in natürlicher Sprache zusammenzufassen, um das Risiko von Fehlinterpretationen zu verringern. Aber wer schreibt schon gerne scheinbar selbstverständliche Beschreibungen unter Diagramme in Berichten oder Präsentationen? Die meisten Menschen nicht, und genau dabei kann KI helfen.

KI-gestütztes NLP kann dir nicht nur dabei helfen, natürlichsprachliche Eingaben zu interpretieren, sondern auch zusammenfassende Texte auf Basis der Daten zu erstellen. Diese automatisch erstellten Texte enthalten beschreibende Merkmale über die Daten sowie bemerkenswerte Veränderungen oder Streams. Hier ist ein Beispiel für eine automatisch generierte Diagrammbeschriftung aus Power BI:

Sales $ for Texas increased for the last 5 years on record and it experienced the longest period of growth in Sales between 2010 and 2014.

Wie du siehst, können diese kleinen, von der KI generierten Textschnipsel dein Leben als Analystin oder Analyst sehr viel einfacher machen und dir viel Zeit sparen, wenn es darum geht, anderen Stakeholdern Erkenntnisse mitzuteilen. Außerdem können sie dabei helfen, die Anforderungen an die Barrierefreiheit für Bildschirmleser zu erfüllen.

Automatisierung nutzen, um Muster in Daten zu finden

Du hast gesehen, wie NLP-Funktionen dir helfen können, effizient beschreibende Erkenntnisse aus deinen Daten zu gewinnen. Der nächste logische Schritt besteht darin, herauszufinden, warum bestimmte Beobachtungen in der Vergangenheit passiert sind, z. B. warum genau sind die Verkäufe in Texas so stark gestiegen?

Bei diagnostischen Analysen musst du normalerweise deinen Datensatz durchkämmen, um aussagekräftige Veränderungen in den zugrunde liegenden Datenverteilungen zu untersuchen. In diesem Beispiel möchtest du vielleicht herausfinden, ob ein bestimmtes Produkt oder ein bestimmtes Ereignis für die Gesamtveränderung verantwortlich ist. Dieser Prozess kann schnell langwierig und mühselig werden. KI kann dir dabei helfen, die time to insight (TTI) zu verkürzen.

Algorithmen sind großartig darin, zugrundeliegende Muster in Daten zu erkennen und sie an die Oberfläche zu bringen. Mit KI-gestützten Tools wie Dekompositionsbäumen oder Key Influencer Analysis kannst du zum Beispiel schnell herausfinden, welche Merkmale in deinen Daten zu dem beobachteten Gesamteffekt geführt haben - und zwar im Handumdrehen. In den Kapiteln 5 und 6 sehen wir uns drei konkrete Beispiele für die Nutzung von KI-gestützten Funktionen in Power BI an, die dein Leben als Datenanalyst oder Business User einfacher machen.

Bessere Prognosen und Vorhersagen

Während deskriptive und diagnostische Analysen das Herzstück eines jeden BI-Systems sind, bestand der dringende Wunsch schon immer darin, nicht nur die Vergangenheit zu verstehen, sondern auch die Zukunft vorherzusehen. Wie in Abbildung 1-5 zeigt, können KI-gestützte Funktionen Endnutzer dabei unterstützen, leistungsstarke prädiktive und präskriptive Analysemethoden für bessere Prognosen und Vorhersagen auf der Grundlage historischer Daten anzuwenden.

Das erhöht die Komplexität, da wir den Bereich der binären Daten aus der Vergangenheit verlassen und probabilistische Vermutungen über die Zukunft einführen, die natürlich viele Unsicherheiten enthalten. Gleichzeitig steigt der Erwartungswert: Wenn wir dabei sind, die Zukunft vorherzusagen, können wir in der Gegenwart viel bessere Entscheidungen treffen.

AI-powered BI: better forecasting and predictions (analytical layer)
Abbildung 1-5. KI-gestützte BI: bessere Prognosen und Vorhersagen (analytische Ebene)

Vielleicht hast du schon einmal von statistischen Methoden wie der Regression oder dem autoregressiven integrierten gleitenden Durchschnitt (ARIMA) gehört (vielleicht in der Schule oder im Grundstudium) und fragst dich, was es mit der KI auf sich hat. Achte auf die beiden folgenden Aspekte:

KI kann mit mehr Daten und weniger menschlicher Aufsicht bessere Prognosen erstellen.
KI nutzt im Kern altbewährte Techniken wie die lineare Regression. Gleichzeitig kann KI diese Techniken aber auch auf komplexe Datensätze anwenden, indem sie stochastische Ansätze nutzt, um schnell eine optimale Lösung zu finden, ohne dass eine umfangreiche menschliche Überwachung erforderlich ist. Spezialisierte Algorithmen für Zeitreihenvorhersagen sind darauf ausgelegt, Muster in größeren Mengen von Zeitreihendaten zu erkennen. KI versucht, die Vorhersage durch die Auswahl von Merkmalen und die Minimierung von Verlustfunktionen zu optimieren. Dies kann zu besseren oder genaueren Vorhersagen mit einem kurzen Zeithorizont führen oder zu dem Versuch, genauere Vorhersagen über einen längeren Zeitraum zu treffen. Komplexere, nichtlineare Modelle können zu detaillierteren und letztendlich besseren Vorhersageergebnissen führen.
KI kann Vorhersagen in großem Umfang berechnen, um die Entscheidungsfindung zu optimieren.
Eine Vorhersage der Gesamtzahl der Kunden im nächsten Quartal ist gut. Aber noch besser ist es, für jeden Kunden in deiner Datenbank eine Abwanderungswahrscheinlichkeit zu berechnen, die auf aktuellen Daten basiert. Mit diesen Informationen können wir nicht nur sagen, welche Kunden im nächsten Monat wahrscheinlich abwandern werden, sondern auch unsere Entscheidungsfindung optimieren. So können wir zum Beispiel feststellen, welche Kunden im nächsten Monat abwandern werden und welche wir mit einer Marketingkampagne ansprechen sollten. Die Kombination von ML mit BI schafft einen potenziell großen Mehrwert für ein Unternehmen. Und mit dem Vormarsch neuartiger Techniken wie automatisiertes maschinelles Lernen (AutoML) und KI als Service (AIaaS), die wir in Kapitel 3 näher beleuchten werden, können Unternehmen die Engpässe beseitigen, die dadurch entstehen, dass sie nicht genügend Datenwissenschaftler oder ML-Experten haben, um diese KI-Potenziale zu nutzen.

KI-Funktionen für verbesserte Prognosen oder bessere Vorhersagen können als integraler Bestandteil bestehender BI-Software (Anwendungsebene) eingesetzt werden. Diese Funktionen können auch unabhängig davon direkt auf der Datenbankebene (analytische Schicht) angewendet werden. Damit sind sie immer verfügbar, egal welches BI-Tool du verwendest. Wie du diese Techniken anwendest, wird in den Kapiteln 7 und 8 erläutert.

Unstrukturierte Daten nutzen

BI Systeme arbeiten in der Regel mit tabellarischen Daten aus relationalen Datenbanken wie Enterprise Data Warehouses. Doch mit der zunehmenden Digitalisierung über alle Kanäle hinweg sehen wir einen dramatischen Anstieg unstrukturierter Daten in Form von Text-, Bild- oder Audiodateien. In der Vergangenheit war es für BI-Nutzer schwierig, diese Daten in großem Umfang zu analysieren. KI ist hier, um das zu ändern.

KI kann die Breite und Tiefe der verfügbaren und maschinenlesbaren Daten erhöhen, indem sie Technologien wie Computer Vision oder NLP einsetzt, um auf neue, bisher ungenutzte Datenquellen zuzugreifen. Unstrukturierte Daten wie rohe Textdateien, PDF-Dokumente, Bilder und Audiodateien können in strukturierte Formate umgewandelt werden, die einem bestimmten Schema entsprechen, wie z. B. eine Tabelle oder eine CSV-Datei, und können dann von einem BI-System genutzt und analysiert werden. Da dies auf der Ebene der Datenerfassung geschieht, betrifft dieser Prozess letztendlich alle Stufen der BI-Plattform (siehe Abbildung 1-6).

Indem wir diese Dateien in unsere Analyse einbeziehen, können wir noch mehr Informationen erhalten, die zu besseren Vorhersagen oder einem besseren Verständnis der wichtigsten Einflussfaktoren führen können. In Kapitel 8 erfährst du anhand von Beispielen, wie das in der Praxis funktioniert.

AI-powered BI: unlocking unstructured data in the ingestion layer
Abbildung 1-6. KI-gestützte BI: Unstrukturierte Daten in der Ingestion-Ebene erschließen

Ein Gespür für KI und maschinelles Lernen bekommen

Wir haben auf viel darüber gesprochen, wie KI mit BI genutzt werden kann. Aber um tatsächlich KI-gestützte Produkte oder Dienstleistungen zu entwickeln, müssen wir tiefer graben und verstehen, was KI ist und was sie leisten kann (und was nicht).

Was ist KI also wirklich? Wenn du 10 Leute fragst, wirst du wahrscheinlich 11 Antworten bekommen. Für den Verlauf dieses Buches ist es wichtig, ein gemeinsames Verständnis davon zu haben, was dieser Begriff eigentlich bedeutet.

Zunächst einmal ist der Begriff " künstliche Intelligenz" nicht neu. Tatsächlich geht der Begriff auf militärische Forschungslabore in den 1950er Jahren zurück. Seitdem haben Forscher/innen viele Ansätze ausprobiert, um das Ziel zu erreichen, dass Computer oder Maschinen die menschliche Intelligenz nachahmen. Wie Abbildung 1-7 zeigt, haben sich seit den Anfängen der KI zwei große Bereiche herausgebildet: die allgemeine KI und die enge KI.

Development of artificial intelligence
Abbildung 1-7. Entwicklung der künstlichen Intelligenz

Allgemeine KI oder starke KI ( ) bezieht sich auf eine Technologie, die darauf abzielt, jedes beliebige Problem zu lösen, das das System noch nie zuvor gesehen hat oder mit dem es konfrontiert wurde, ähnlich wie das menschliche Gehirn. Allgemeine KI ist nach wie vor ein heißes Forschungsthema, aber sie ist noch ziemlich weit weg; Forscher/innen sind sich immer noch nicht sicher, ob sie jemals erreicht werden wird.

Narrow AI ( ) hingegen bezieht sich auf eine ziemlich spezifische Lösung, die in der Lage ist, ein einziges, genau definiertes Problem zu lösen, für das sie entwickelt und trainiert wurde. Narrow AI hat alle KI-Durchbrüche der jüngeren Vergangenheit ermöglicht, sowohl in der Forschung als auch in praktischen oder geschäftsbezogenen Bereichen.

Im Kern der engen KI hat sich ein Ansatz in Bezug auf die Auswirkungen auf das Geschäft und die Entwicklungsfortschritte hervorgetan: maschinelles Lernen. Wann immer ich in diesem Buch über KI spreche, geht es um Lösungen, die durch maschinelles Lernen möglich geworden sind. Deshalb verwende ich in diesem Buch die Begriffe KI und ML synonym und betrachte KI als einen ziemlich weit gefassten Begriff mit einer recht wörtlichen Bedeutung: KI ist ein Werkzeug, um (scheinbar) intelligente Wesen zu schaffen, die in der Lage sind, bestimmte Aufgaben zu lösen, vor allem mithilfe von ML.

Nachdem die Beziehung zwischen KI und ML nun hoffentlich etwas klarer geworden ist, lass uns darüber sprechen, worum es bei ML eigentlich geht. ML ist ein Programmierparadigma, das darauf abzielt, für einen bestimmten Zweck Muster in Daten zu finden. ML besteht in der Regel aus zwei Phasen: Lernen (Training) und Inferenz (auch Testen oder Vorhersage genannt).

Der Kerngedanke hinter ML ist, dass wir Muster in historischen Daten finden, um eine bestimmte Aufgabe zu lösen, z. B. Beobachtungen in Kategorien einordnen, Wahrscheinlichkeiten auswerten oder Ähnlichkeiten zwischen Elementen finden. Ein typischer Anwendungsfall für ML ist die Analyse historischer Kundentransaktionsdaten, um die individuellen Wahrscheinlichkeiten der Kundenabwanderung zu berechnen. Bei der Inferenz besteht unser Ziel darin, eine Vorhersage für einen neuen Datenpunkt zu berechnen, und zwar unter Berücksichtigung aller Informationen, die wir aus den historischen Daten gewonnen haben.

Damit du ML besser verstehst, wollen wir die Kernbestandteile unserer Definition auspacken:

Ein Programmierparadigma

Herkömmliche Software wird durch die Programmierung von Regeln für ein bestimmtes Programm erstellt. Wenn du ein Kundensupportsystem entwickelst, denkst du dir die ganze Logik aus, die passieren soll, nachdem ein Kunde ein Support-Ticket eingereicht hat (z.B. Benachrichtigung der Support-Mitarbeiter per E-Mail). Du dokumentierst alle Regeln, fügst sie in dein Programm ein und lieferst die Software aus.

ML kehrt dieses Paradigma jedoch um. Anstatt Regeln fest in ein System zu programmieren, gibst du genügend Beispiele für Eingaben und gewünschte Ausgaben (Labels) ein und überlässt es dem ML-Algorithmus, den Regelsatz für dich zu erstellen. Diese Vorgehensweise ist zwar für den Aufbau eines Kundensupportsystems ungeeignet, aber sie eignet sich hervorragend für bestimmte Szenarien, in denen die Regeln nicht bekannt oder schwer zu beschreiben sind. Wenn du z. B. Kundendienstanfragen auf der Grundlage verschiedener Merkmale wie dem Anfragetext, dem Kundentyp und dem Erstellungsdatum der Anfrage priorisieren möchtest, kann ein ML-Algorithmus ein Priorisierungsmodell für dich erstellen, indem er sich ansieht, wie frühere Anfragen priorisiert wurden. Anstatt eine komplizierte Wenn-dann-es-Logik zu entwickeln, findet der ML-Algorithmus das heraus, wenn er über eine gewisse Rechenzeit und Rechenressourcen verfügt.

Muster in Daten finden
Um nützliche Muster in Daten zu finden, spielen drei wichtige Konzepte zusammen: Algorithmus, Training und Modell. Ein ML-Modell ist der Satz von Regeln oder die mathematische Funktion, die einen Ausgabewert für eine bestimmte Dateneingabe berechnet. Stell dir das Modell als einen großen Stapel von gewichteten Wenn-dann-es-Anweisungen vor. Der ML-Algorithmus beschreibt den Rechenprozess, den eine Maschine durchlaufen muss, um zu diesem Modell zu gelangen. Und der Begriff Training bedeutet, dass ein vorhandener Datensatz viele Male durchlaufen wird, um das bestmögliche Modell für diesen speziellen Datensatz zu finden, das sowohl einen niedrigen Vorhersagefehler als auch eine gute Generalisierung auf neue, ungesehene Dateneingaben liefert, damit das Modell für einen bestimmten Zweck verwendet werden kann.
Ein besonderer Zweck
ML-Aufgaben werden in der Regel nach dem Problem kategorisiert, das sie zu lösen versuchen. Die wichtigsten Bereiche sind überwachtes und unüberwachtes Lernen. Obwohl dies kein Buch über ML-Grundlagen ist, gehen wir in Kapitel 3 etwas ausführlicher auf sie ein.

Wenn wir alle Komponenten berücksichtigen, besteht die Aufgabe eines ML-Praktikers in einer realen Situation darin, so viele Daten wie möglich über die betreffende Situation zu sammeln, einen Algorithmus auszuwählen und abzustimmen, um ein Modell der Situation zu erstellen, und dann das Modell so zu trainieren, dass es genau genug ist, um nützlich zu sein.

Eine der größten Fehleinschätzungen über KI und ML, die Führungskräfte oft haben, ist, dass KI und ML super schwer zu implementieren sind. Die Entwicklung und Pflege spezifischer, leistungsstarker ML-Systeme ist zwar eine anspruchsvolle Aufgabe, aber wir müssen auch anerkennen, dass KI inzwischen zu einem Massenprodukt geworden ist und kommerzialisiert wurde, so dass auch Nicht-ML-Experten mit bestehenden Code-Bibliotheken oder No-Code- bzw. Low-Code-Lösungen gut funktionierende ML-Lösungen entwickeln können. In Kapitel 4 erfährst du mehr über diese Techniken, damit du ML-Lösungen ohne die Hilfe von Datenwissenschaftlern oder ML-Ingenieuren selbst implementieren kannst.

Der BegriffKI kann beängstigend und einschüchternd für Menschen sein, die nicht wirklich wissen, was er bedeutet. Die Wahrheit ist, dass wir von The Terminator und allgemeiner KI noch weit entfernt sind. Wenn du eine breitere Akzeptanz und Einführung von KI-Lösungen in deinem Unternehmen erreichen willst, musst du den Begriff KI in einer freundlichen und nichttechnischen Sprache vermitteln. Wenn du an KI als Automatisierung denkst oder an die Möglichkeit, bessere Entscheidungen auf der Grundlage früheren Lernens zu treffen, solltest du dich wohl genug fühlen, um potenziell gute Anwendungsfälle zu erkennen und diesen Geist mit deinen Kolleginnen und Kollegen zu teilen.

KI-Nutzungsfall-Ideen auf Geschäftsauswirkungen abbilden

Nachdem du nun mehr über KI und ihre Anwendung auf BI erfahren hast, hast du vielleicht schon einige Ideen im Kopf, wie du KI auf deine eigenen Anwendungsfälle anwenden kannst. Um herauszufinden, welche davon das meiste Potenzial haben und es wert sind, ausgearbeitet zu werden, werfen wir einen Blick auf ein Story-Mapping-Framework, das du für genau diesen Zweck nutzen kannst. Das Framework ist von den Techniken des agilen Projektmanagements inspiriert und soll dir helfen, deinen Denkprozess zu strukturieren.

Der Kerngedanke dieses KI-Story-Mapping-Frameworks besteht darin, die derzeitige Umsetzung eines Prozesses mit einer KI-gestützten Umsetzung dieses Prozesses zu vergleichen. Auf diese Weise erhältst du einen umfassenden Überblick darüber, was anders wäre, welche Dinge du ändern müsstest und vor allem, wie du deinen Denkprozess strukturieren kannst.

Die Erstellung eines Storyboards ist ganz einfach. Nimm ein leeres Blatt Papier und unterteile es in eine Tabelle mit vier Spalten und zwei Zeilen. Die vier oberen Kästchen bilden deinen aktuellen Prozess ab, und die unteren Kästchen beschreiben die zukünftige, voraussichtliche Umsetzung. Benenne die Spalten von links nach rechts: Aufbau, Aktionen, Ergebnisse, Resultate. Abbildung 1-8 zeigt, wie dein Blatt Papier aussehen sollte.

Storyboard template
Abbildung 1-8. Storyboard-Vorlage

Um dein Storyboard zu erstellen, musst du die Spalten von links nach rechts ausfüllen. Du beginnst mit der ersten Zeile, in der du beschreibst, wie die aktuelle Umsetzung eines bestimmten Prozesses entlang der folgenden Dimensionen funktioniert:

Einrichtung
Beschreibt, wie der Prozess beginnt und listet deine Annahmen, Ressourcen oder Startkriterien auf.
Aktionen
Enthält alle Aufgaben und Aktionspunkte, die von oder für die in der Einrichtung angegebene Ressource ausgeführt werden.
Ergebnisse
Beschreibt die eigentlichen Artefakte des Prozesses. Was genau wird erzeugt, erstellt oder verändert?
Ergebnisse
Enthält die Auswirkungen, die die Ergebnisse auf das Unternehmen haben, und/oder die nachfolgenden nächsten Schritte für die Ergebnisse. Die Anzeige eines Berichts in einem Dashboard ist zum Beispiel ein Ergebnis, hat aber für sich genommen keine Auswirkungen. Die Auswirkung ist, was auf der Grundlage der im Dashboard angezeigten Informationen geschieht und wer dies tut.

Im nächsten Schritt machst du das Gleiche für die voraussichtliche zukünftige Umsetzung. Am Ende hast du einen direkten Vergleich zwischen dem alten und dem neuen Ansatz, der dir mehr Klarheit darüber verschafft, wie sich die Dinge ändern werden und welche Auswirkungen diese Änderungen haben könnten. Abbildung 1-9 zeigt ein Beispiel-Storyboard für unseren Anwendungsfall "Kundenabwanderung", um die Funktionsweise dieser Übung zu verdeutlichen.

Storyboard example
Abbildung 1-9. Beispiel für ein Storyboard

Lass uns durch unser Storyboard-Beispiel gehen. Wir beginnen in der linken oberen Ecke und legen die aktuellen Einstellungen für den bestehenden Prozess fest.

Gegenwärtig wird die Kundenabwanderung von Vertriebsmitarbeitern festgestellt, die bei ihren regelmäßigen Gesprächen mit bestehenden Kunden Feedback erhalten, oder von Mitarbeitern des Kundensupports, die von Kunden die Rückmeldung erhalten, dass einige Dinge nicht so funktionieren, wie sie es sich erhofft haben, oder dass sie andere Probleme haben. Im nächsten Schritt versuchen Kundenbetreuer/innen oder Vertriebsmitarbeiter/innen, das Problem direkt mit dem/der Kunden/in zu lösen - zum Beispiel, indem sie Hilfe beim Onboarding anbieten.

Das Hauptergebnis dieses Prozesses ist, dass der Kundensupport (hoffentlich) die bestehenden Probleme und Beschwerden des Kunden löst. Schmerzpunkte können der Managementebene oder dem Beschwerdemanagementsystem gemeldet werden. Das Ergebnis ist, dass der Kunde hoffentlich bei der aktuellen Dienstleistung bleibt, nachdem das Problem behoben wurde.

Stellen wir dem eine KI-gestützte Implementierung gegenüber, beginnend in der linken unteren Ecke und dann nach rechts. In unserem Fall würden wir historische Daten darüber sammeln, wie Kunden verschiedene Produkte und Dienstleistungen nutzen, und Kunden markieren, die abgewandert sind und solche, die nicht abgewandert sind. Außerdem würden wir Mitarbeiter aus dem Vertrieb und dem Kundenservice einbeziehen, die ihr Fachwissen mit dem Analysten in der Schleife teilen.

Als Nächstes würden wir die historischen Daten analysieren, um festzustellen, ob die wichtigsten Faktoren für die Kundenabwanderung im Datensatz identifiziert werden können. Wenn ja, würden wir ein Prognosemodell entwickeln, um für jeden Kunden in unserer Datenbank ein individuelles Abwanderungsrisiko zu berechnen und die Gründe für die Abwanderung zu ermitteln.

Als Ergebnis würden diese Abwanderungsrisikowerte und Abwanderungsgründe dem Unternehmen präsentiert werden. Die Informationen könnten mit anderen Kennzahlen, wie z. B. dem Kundenumsatz, kombiniert und in einem Bericht im Customer Relationship Management (CRM) oder BI-System dargestellt werden.

Mit diesen Informationen kann der Kundensupport nun proaktiv auf Kunden mit einem hohen Abwanderungsrisiko zugehen und versuchen, das Problem zu lösen oder Hindernisse zu beseitigen, bevor der Kunde ein Support-Ticket auslöst oder sich abwendet, ohne überhaupt ein Ticket zu öffnen. Infolgedessen sollte die Gesamtabwanderungsrate im Laufe der Zeit sinken, weil das Unternehmen die Gründe für die Kundenabwanderung in größerem Umfang besser angehen kann.

Mit beiden Storymaps - dem bestehenden und dem neuen Prozess - solltest du dich sicherer fühlen, wenn du beschreibst, wie eine mögliche KI-Lösung aussehen könnte, welche Vorteile sie bringen könnte und ob es überhaupt sinnvoll ist, den neuen Ansatz zu verfolgen, indem du ihn entweder ersetzt oder mit dem bestehenden Prozess kombinierst. Verwende die Storyboard-Vorlage und zeichne zwei oder drei KI-Ideen für einen Anwendungsfall auf. Welche dieser Ideen scheint dir am vielversprechendsten zu sein?

Der Zweck eines Storyboards besteht also darin, für jeden Anwendungsfall einen einfachen One-Pager zu erstellen, der die Unterschiede und Vorteile der bestehenden und der neuen Lösung intuitiv gegenüberstellt. Ein Storyboard hilft dir, deinen Denkprozess zu strukturieren, und ist ein guter Ausgangspunkt für die Priorisierung von KI-Anwendungsfällen.

Zusammenfassung

In diesem Kapitel hast du erfahren, wie KI die BI-Landschaft verändert, angetrieben durch den Bedarf der Geschäftsanwender, schnellere Antworten aus den Daten zu erhalten, die wachsende Nachfrage nach demokratischen Erkenntnissen und eine insgesamt höhere Verfügbarkeit von standardisierten ML-Tools. Wir haben untersucht, wie genau KI BI durch Automatisierung und bessere Benutzerfreundlichkeit, verbesserte Prognosen und den Zugang zu neuen Datenquellen unterstützen kann, damit die Menschen bessere Entscheidungen treffen können. Inzwischen solltest du ein grundlegendes Verständnis davon haben, wie KI und ML funktionieren und welche Möglichkeiten sie heute bieten. Außerdem hast du gelernt, ein Framework zu nutzen, das dir hilft, deinen Denkprozess zu strukturieren und Ideen für ML-Anwendungsfälle zu entwickeln.

Im nächsten Kapitel gehen wir näher darauf ein, wie KI-Systeme aufgebaut sind und welche Faktoren du berücksichtigen musst, bevor du diese Technologien in deine BI-Dienste einbaust.

Get KI-gestützte Business Intelligence now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.