Prólogo
Allá por 2016-17, era vicepresidente de investigación en Gartner y cubría una nueva categoría tecnológica llamada plataformas de datos de clientes (CDP), y la pregunta más habitual que recibíamos mi equipo y yo era: "¿Qué es eso llamado CDP?". No es una pregunta retórica: contamos cuántas veces la gente hacía la pregunta, y realmente querían saberlo.
En aquel momento, las CDP estaban subiendo como la espuma en el Hype Cycle de Gartner, y el hombre que las nombró por primera vez -el consultor en tecnología de marketing David Raab- pronunció un discurso de apertura en la Conferencia MarTech 2018 de Boston titulado "¡Las CDP curan la calvicie!".
Raab bromeaba sobre la calvicie (creo), pero es cierto que cuando los CDP alcanzaron el pico de las expectativas infladas a finales de la década de 2010, la mayoría de las grandes empresas con complejas diásporas de datos de clientes se plantearon al menos añadir un CDP a su pila. Ahora, la mayoría tiene al menos una.
La categoría CDP pasó de casi nada a mediados de la década de 2010 a un mercado estimado de 10.000 millones de dólares en 2025, según la Corporación Internacional de Datos (IDC). Como fenómeno histórico-tecnológico, el CDP es inusual. También ha disfrutado de una evolución cartográfica continua, ya que diferentes usuarios han trazado diferentes límites a su alrededor y la gestión de las relaciones con los clientes (CRM), la gestión de datos maestros, los almacenes de datos, los lagos, los marts, etc.
De hecho, el CDP surgió para resolver un problema muy concreto de la tecnología empresarial: los datos atrapados. Sus primeros defensores fueron vendedores, sobre todo minoristas, que habían heredado (o construido) docenas de aplicaciones y almacenes de datos de clientes bastante desconectados. Todas estas aplicaciones y bases de datos diferentes podían contener información sobre el mismo cliente, aislada en su propia isla desierta, atrapada en un único canal, tabla o cola.
El propósito de la CDP era liberar esos datos y conectarlos a un perfil único; aplicar la gestión de identidades; y organizar el perfil para que pudiera ser analizado, modelado, segmentado, enviado a otros sistemas y, finalmente, puesto en uso. Decir que las CDP crean "sólo otro silo" -algo que oí con demasiada frecuencia en los primeros tiempos- es para mí como decir que el motor de búsqueda de Google crea "sólo otro sitio web". Las CDP hacen que otras cosas tengan sentido.
Salesforce se unió al movimiento CDP en 2020, y su solución acabó evolucionando hasta convertirse en Salesforce Data Cloud, el tema de este magistral libro práctico de Joyce Kay Avila. Desde el principio, Salesforce abordó el problema de los "datos atrapados" desde una perspectiva especial, impulsada por su posición como plataforma líder de CRM y servicios. Al final, Data Cloud se convirtió en el producto orgánico de mayor crecimiento que Salesforce haya lanzado nunca y en uno de los productos de software de mayor crecimiento de la historia.
Existe un parecido familiar entre CRM y CDP. Al fin y al cabo, la C de ambos tiene el mismo significado. Salesforce tenía la ventaja de contar ya con una plataforma como servicio (PaaS) ampliamente utilizada, construida sobre un marco de metadatos, con una interfaz de usuario sin código (Lightning), un mercado de aplicaciones para socios (AppExchange), capacidades analíticas avanzadas (Einstein) y una plataforma de aprendizaje (Trailhead).
Todo lo que necesitaba era un lago de datos a escala de empresa a consumidor (B2C), compatible con el procesamiento por lotes y en tiempo real. Así que, además de su visión de plataforma única, Nube de Datos se construyó para soportar los nuevos patrones arquitectónicos de datos presentes en la empresa moderna (véase el Capítulo 2). Otras consideraciones fueron la apertura y la extensibilidad -sin datos "bloqueados"- y la compatibilidad con las consultas en tiempo real, el aprendizaje automático (ML) y la IA.
Conocí a Joyce Kay Avila en Salesforce Connections, el evento anual de marketing y comercio de Chicago. La conocía por su reputación como influencer en YouTube y evangelizadora de Salesforce y Snowflake, y más tarde por su excelente Snowflake: The Definitive Guide (O'Reilly, 2022). Es una explicadora nata, profunda conocedora del uso de estas tecnologías como profesional y como sintetizadora.
Estamos encantados de que Joyce haya decidido aprovechar sus años de experiencia en el ecosistema de Salesforce para escribir Hands-On Salesforce Data Cloud. Es la primera, y ya definitiva, guía práctica para configurar, gestionar, utilizar y optimizar esta popular solución. Pone todos los elementos en contexto y tiene una claridad de voz que ojalá otros escritores de tecnología pudieran copiar y pegar.
Son especialmente señalados los apartados sobre resolución de identidades(Capítulo 10) y sobre segmentación y activación(Capítulo 12). La gestión de la identidad es un tema complicado, fundamental para la idea de un perfil unificado. Alguna forma de segmentación o analítica basada en perfiles de usuario más completos y oportunos sigue siendo el principal caso de uso de la Nube de Datos, y ambos temas se desentrañan muy claramente aquí.
¿Hacia dónde se dirige la Nube de Datos, e incluso la categoría CDP? Algunas de las nuevas capacidades descritas en el Capítulo 2 señalan el camino. La adopción generalizada de almacenes nativos de la nube, como Snowflake, suscitó un gran interés por el intercambio de datos sin extracción, transformación ni carga (ETL cero) con Nube de Datos, y esta capacidad se introdujo como Bring Your Own Lake (BYOL) en 2024, empezando por Snowflake y BigQuery de Google. Del mismo modo, se introdujeron los gráficos de datos y las bases de datos vectoriales para apoyar el acceso a datos no estructurados.
Los datos no estructurados son el núcleo de las nuevas aplicaciones de IA Generativa (GenAI). Éstas ya están haciendo que el software empresarial sea más fácil de usar (mediante copilotos) y más potente. El uso de la IA y la GenAI se extiende mucho más allá de la generación de texto e imágenes hacia la analítica, la predicción, la automatización y las decisiones, pero nada ocurre sin datos fiables. La revolución de la IA es, de hecho, una revolución de los datos.
Todo esto hace que desentrañar los datos sea esencial para la empresa preparada para la IA, y tenemos suerte de contar con una guía como Joyce Kay Avila para ayudarnos a entender cómo hacerlo con Salesforce Data Cloud.
Get Salesforce Data Cloud práctico now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.