Vorwort

In den Jahren 2016-17 war ich als Research VP bei Gartner tätig und befasste mich mit einer neuen Technologiekategorie, den Kundendatenplattformen (CDPs), und die häufigste Frage, die mein Team und ich gestellt bekamen, war: "Was ist das eigentlich, eine CDP?" Das ist keine rhetorische Frage: Wir haben gezählt, wie oft die Leute diese Frage gestellt haben, und sie wollten es wirklich wissen.

Zu dieser Zeit waren CDPs im Gartner Hype Cycle auf dem Vormarsch, und der Mann, der sie als Erster benannt hatte - der Marketingtechnologieberater David Raab - hielt auf der MarTech Conference 2018 in Boston eine Grundsatzrede mit dem Titel "CDP Cures Baldness!"

Raab hat einen Scherz mit der Glatze gemacht (glaube ich) - aber es stimmt, dass Ende der 2010er Jahre, als die CDPs den Höhepunkt der aufgeblähten Erwartungen erreichten, die meisten größeren Unternehmen mit komplexen Kundendaten-Diasporas zumindest in Erwägung zogen, eine CDP in ihren Stack aufzunehmen. Die meisten von ihnen haben jetzt mindestens eine.

Laut der International Data Corporation (IDC) wuchs die CDP-Kategorie von fast nichts in der Mitte der 2010er Jahre auf einen geschätzten Markt von 10 Milliarden Dollar im Jahr 2025. Als technikgeschichtliches Phänomen ist das CDP ungewöhnlich. Sie hat auch eine kontinuierliche kartografische Entwicklung durchlaufen, da verschiedene Nutzer unterschiedliche Grenzen zwischen ihr und Customer Relationship Management (CRM), Master Data Management, Data Warehouses, Lakes, Marts und mehr gezogen haben.

Tatsächlich entstand die CDP, um ein ganz bestimmtes Problem in der Unternehmenstechnologie zu lösen: die Datenfalle. Die ersten Befürworter waren Vermarkter, insbesondere Einzelhändler, die Dutzende von ziemlich unzusammenhängenden Anwendungen und Kundendatenspeichern geerbt (oder aufgebaut) hatten. All diese verschiedenen Anwendungen und Datenbanken konnten Informationen über ein und denselben Kunden enthalten, die auf ihrer eigenen einsamen Insel in einem einzigen Kanal, einer Tabelle oder einer Warteschlange gefangen waren.

Der Zweck der CDP bestand darin, diese Daten freizugeben und sie mit einem einzigen Profil zu verbinden, Identitätsmanagement anzuwenden und das Profil so zu organisieren, dass es analysiert, modelliert, segmentiert, an andere Systeme gesendet und schließlich genutzt werden konnte. Zu sagen, dass CDPs "nur ein weiteres Silo" schaffen - etwas, das ich in den ersten Tagen viel zu oft gehört habe - ist für mich so, als würde man sagen, dass die Suchmaschine von Google "nur eine weitere Website" schafft. CDPs machen andere Dinge erst sinnvoll.

Salesforce schloss sich der CDP-Bewegung im Jahr 2020 an und seine Lösung entwickelte sich schließlich zu Salesforce Data Cloud, dem Thema dieses meisterhaften Praxisbuchs von Joyce Kay Avila. Von Anfang an ging Salesforce das Problem der "gefangenen Daten" aus einer besonderen Perspektive an, angetrieben durch seine Position als führende CRM- und Service-Plattform. Letztendlich wurde die Data Cloud das am schnellsten wachsende organische Produkt, das Salesforce je auf den Markt gebracht hat, und eines der am schnellsten wachsenden Softwareprodukte überhaupt.

Zwischen CRM und CDP gibt es eine gewisse Ähnlichkeit. Schließlich hat das C in beiden dieselbe Bedeutung. Salesforce hatte den Vorteil, bereits eine weit verbreitete Platform as a Service (PaaS) zu betreiben, die auf einem Metadaten-Framework aufbaut, mit einer No-Code-UI (Lightning), einem Marktplatz für Partneranwendungen (AppExchange), erweiterten Analysefunktionen (Einstein) und einer Lernplattform (Trailhead).

Alles, was es brauchte, war ein Business-to-Consumer (B2C)-Data Lakehouse, das sowohl Batch- als auch Echtzeitverarbeitung unterstützt. Neben der Vision einer einzigen Plattform wurde die Data Cloud also so konzipiert, dass sie die neuen architektonischen Datenmuster in modernen Unternehmen unterstützt (siehe Kapitel 2). Weitere Überlegungen waren Offenheit und Erweiterbarkeit - keine "gesperrten" Daten - sowie Unterstützung für Echtzeitabfragen, maschinelles Lernen (ML) und KI.

Ich bin Joyce Kay Avila zum ersten Mal auf der Salesforce Connections begegnet, der jährlichen Marketing- und Handelsveranstaltung in Chicago. Ich kannte sie als YouTube-Influencerin und Evangelistin für Salesforce und Snowflake und später durch ihr ausgezeichnetes Snowflake: The Definitive Guide (O'Reilly, 2022). Sie ist eine geborene Erklärerin, die sowohl als Praktikerin als auch als Syntheseexpertin über den Einsatz dieser Technologien Bescheid weiß.

Wir freuen uns sehr, dass Joyce sich entschlossen hat, ihre jahrelange Erfahrung im Salesforce-Ökosystem in das Buch Hands-On Salesforce Data Cloud einfließen zu lassen. Es ist der erste und bereits maßgebliche praktische Leitfaden zur Einrichtung, Verwaltung, Nutzung und Optimierung dieser beliebten Lösung. Sie stellt alle Elemente in einen Zusammenhang und hat eine klare Sprache, von der ich mir wünschte, dass andere Technologieautoren sie kopieren könnten.

Besonders hervorzuheben sind die Abschnitte zur Identitätsauflösung(Kapitel 10) und zur Segmentierung und Aktivierung(Kapitel 12). Identitätsmanagement ist ein kompliziertes Thema, das für die Idee eines einheitlichen Profils von zentraler Bedeutung ist. Eine Form der Segmentierung oder Analyse auf der Grundlage vollständigerer und aktuellerer Nutzerprofile ist nach wie vor der wichtigste Anwendungsfall für die Data Cloud, und beide Themen werden hier sehr deutlich herausgearbeitet.

Wohin entwickelt sich die Data Cloud - und sogar die Kategorie CDP -? Einige der neueren Möglichkeiten, die in Kapitel 2 beschrieben wurden, weisen den Weg. Die weit verbreitete Einführung von Cloud-nativen Warehouses wie Snowflake hat das Interesse an der gemeinsamen Nutzung von Daten ohne ETL (Extrahieren, Transformieren, Laden) in der Data Cloud geweckt, und diese Fähigkeit wurde 2024 als Bring Your Own Lake (BYOL) eingeführt, beginnend mit Snowflake und Googles BigQuery. Ebenso wurden Datengraphen und Vektordatenbanken eingeführt, um den Zugriff auf unstrukturierte Daten zu unterstützen.

Unstrukturierte Daten sind das Herzstück der neueren generativen KI-Anwendungen (GenAI). Diese machen Unternehmenssoftware bereits einfacher (über Copiloten) und leistungsfähiger. Der Einsatz von KI und GenAI geht weit über die Generierung von Texten und Bildern hinaus und erstreckt sich auf Analysen, Vorhersagen, Automatisierung und Entscheidungen - aber nichts geschieht ohne vertrauenswürdige Daten. Die KI-Revolution ist in Wirklichkeit eine Datenrevolution.

All das macht die Entschlüsselung von Daten für ein KI-fähiges Unternehmen unabdingbar, und wir können uns glücklich schätzen, dass wir einen Leitfaden wie Joyce Kay Avila haben, der uns dabei hilft, zu verstehen, wie man das mit der Salesforce Data Cloud macht.

Get Salesforce Data Cloud zum Anfassen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.