Capítulo 1. Crear valor empresarial con la IA

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, vamos a explorar por qué la adopción de la IA en la inteligencia empresarial (BI) es cada vez más importante y cómo pueden utilizarla los equipos de BI. Para ello, identificaremos las áreas típicas en las que la IA puede apoyar las tareas y procesos de BI, y examinaremos las capacidades subyacentes de aprendizaje automático (ML). Al final del capítulo, repasaremos un marco práctico que te permitirá asignar las capacidades de IA/ML a los dominios problemáticos de BI.

Cómo la IA está cambiando el panorama del BI

En los últimos 30 años, el BI se ha convertido lenta pero constantemente en la fuerza motriz de las culturas basadas en datos de las empresas, al menos hasta que la atención se desplazó hacia la ciencia de datos, el ML y la IA. ¿Cómo ha ocurrido esto? ¿Y qué significa esto para tu organización de BI?

Cuando nos remontamos al principio de la primera era de los sistemas de apoyo a la toma de decisiones, en los años 70, vemos sistemas técnicos utilizados por expertos en TI para obtener información a partir de conjuntos de datos pequeños (para la escala actual). Estos sistemas evolucionaron y acabaron conociéndose como BI a finales de los 80. El análisis de datos era algo nuevo, por lo que incluso los conocimientos más básicos parecían asombrosos. De repente, las decisiones ya no se basaban en el instinto, sino en datos reales que permitían tomar decisiones más seguras y audaces en escenarios empresariales complejos.

La segunda era del BI comenzó a mediados de la década de 2000 y estuvo dominada por la analítica de autoservicio. Una plétora de nuevas herramientas y tecnologías facilitó más que nunca a un público no técnico el corte y la división de los datos, la creación de visualizaciones y la extracción de información de fuentes de datos cada vez mayores. Las ofrecían principalmente grandes proveedores de software, como Oracle, SAP y Microsoft, pero también estimularon el crecimiento de empresas especializadas en BI, como Tableau Software. El software de hoja de cálculo también se integró cada vez más en el ecosistema general de análisis de datos, por ejemplo, permitiendo a los usuarios empresariales acceder a los cubos de procesamiento analítico en línea (OLAP) de en un sistema Microsoft SQL Server mediante tablas dinámicas en Microsoft Excel.

Hoy en día, la mayoría de las grandes empresas siguen estancadas en esta segunda fase del BI. ¿A qué se debe? En primer lugar, muchos esfuerzos tecnológicos de los últimos años se han centrado en gestionar técnicamente el crecimiento exponencial de los datos subyacentes que los sistemas de BI fueron diseñados para procesar y obtener información. En segundo lugar, el aumento de la cantidad de datos, impulsado principalmente por el crecimiento de Internet y los servicios digitales (véase la Figura 1-1), ha provocado una escasez cada vez mayor de personas con conocimientos de datos, capacitadas para manejar conjuntos de datos de alta dimensión y las herramientas para hacerlo (en este caso, no Excel).

Data growth in recent years (source: Statista)
Figura 1-1. Crecimiento de los datos en los últimos años. Fuente: Statista

En comparación con el mercado de consumo, las aplicaciones de IA siguen estando desatendidas en el espacio profesional de BI. Esto se debe probablemente a que los talentos de IA y BI se sientan en equipos diferentes dentro de las organizaciones, y si alguna vez se encuentran, les cuesta comunicarse eficazmente entre sí. Esto se debe principalmente a que ambos equipos suelen hablar idiomas distintos y tienen prioridades diferentes: Los expertos en BI no suelen hablar mucho sobre formación y pruebas de datos, y los científicos de datos rara vez charlan sobre paquetes de Servicios de Integración de SQL Server (SSIS) y rutinas de extracción, transformación y carga (ETL).

Sin embargo, la necesidad de de adoptar la IA en BI va a aumentar inevitablemente, basándose en las siguientes tendencias actuales:

La necesidad de obtener respuestas rápidas a partir de los datos
Para seguir siendo competitivas y crecer, las organizaciones exigen información basada en datos. Los analistas de datos se ven abrumados con peticiones para explorar tal o cual métrica o examinar tal o cual conjunto de datos. Al mismo tiempo, aumenta la necesidad de los usuarios empresariales de obtener respuestas rápidas y sencillas a partir de los datos. Si pueden preguntar a Google o a Amazon Alexa sobre la cotización actual de una determinada empresa, ¿por qué no pueden preguntar a su sistema profesional de BI sobre las cifras de ventas de ayer?
Democratización de los conocimientos
Los usuarios empresariales se han acostumbrado a obtener información de los datos con soluciones de BI de autoservicio. Sin embargo, los datos actuales son a menudo demasiado grandes y complejos para entregarlos a la empresa para un análisis de autoservicio puro. El aumento del volumen, la variedad y la velocidad de los datos dificulta, si no imposibilita, que los usuarios no técnicos analicen los datos con herramientas familiares en sus ordenadores locales. Para seguir democratizando la información en toda la organización, se necesitan sistemas de BI fáciles de usar y que ofrezcan información automáticamente a los usuarios finales.
Accesibilidad de los servicios de LD
Aunque el uso de la IA en sigue aumentando en las organizaciones, también lo hace la expectativa de mejores previsiones o mejores predicciones. Esto se aplica aún más al BI; las plataformas de código bajo o sin código hacen que sea más fácil que nunca poner las tecnologías de ML a disposición de los no científicos de datos y presiona a los miembros del equipo de BI para que incorporen perspectivas predictivas en sus informes. Se espera que los mismos avances en la ciencia de datos se produzcan también en el campo del BI, tarde o temprano.

Para que comprenda mejor cómo pueden aprovechar la IA los equipos de BI, repasemos brevemente el modelo de conocimiento analítico publicado por Gartner(Figura 1-2).

La funcionalidad básica de toda infraestructura de BI o de elaboración de informes es ofrecer una visión retrospectiva y una perspectiva mediante el uso de análisis descriptivos y análisis de diagnóstico sobre datos históricos. Estos dos métodos son fundamentales para todos los demás procesos analíticos que se superponen a ellos.

En primer lugar, una organización necesita comprender qué ocurrió en el pasado y qué impulsó esos acontecimientos desde el punto de vista de los datos. Esto suele denominarse informes básicos con algunas funciones de insight. La dificultad y complejidad técnicas son comparativamente bajas, pero también lo es el valor intrínseco de esta información. No me malinterpretes: los informes fiables y estructurados siguen siendo la columna vertebral más importante de la analítica de datos en la empresa, ya que sientan las bases de conceptos más avanzados y desencadenan preguntas o problemas que impulsan nuevos análisis. De hecho, cada etapa del modelo de insights es inclusiva de todas las etapas anteriores. No puedes hacer análisis predictivo hasta que no des sentido a tus datos históricos.

Types of insights and analytic methodologies
Figura 1-2. Tipos de percepciones y metodologías analíticas. Fuente: Gartner

Considera el siguiente ejemplo. Una empresa de telecomunicaciones tiene clientes que se suscriben mensualmente a un servicio. Cada mes, un cierto número de clientes no renovará su contrato de servicio y abandonará la relación comercial, un fenómeno que se denomina rotación de clientes en.

El requisito más básico para un sistema de BI sería comprender cuántos clientes han abandonado en el pasado y cómo ha evolucionado este abandono a lo largo del tiempo. El análisis descriptivo nos daría la información necesaria para averiguar el nivel de rotación a lo largo del tiempo y si realmente tenemos un problema. El Cuadro 1-1 ofrece un ejemplo de cómo podría ser.

Tabla 1-1. Tasa de bajas a lo largo del tiempo (análisis descriptivo)
Q1 Q2
Mes 22 de enero 22 de febrero 22 de marzo 22 de abril 22 de mayo 22 de junio
Tasa de rotación 24% 26% 22% 29% 35% 33%

El valor intrínseco de esta información es bastante bajo. A este nivel, el análisis no puede decir realmente por qué se ha producido el fenómeno observado ni qué hacer al respecto. Pero al menos indica si tenemos algún problema: en la tabla podemos ver que la tasa de rotación en el 2º trimestre parece ser significativamente mayor que en el 1º, por lo que podría merecer la pena investigarlo aún más.

Ahí es donde entran en juego los análisis de diagnóstico. Ahora podríamos profundizar y enriquecer los datos de ventas transaccionales con más información sobre los clientes; por ejemplo, los grupos de edad de los clientes, como se muestra en la Tabla 1-2.

Tabla 1-2. Tasa de abandono a lo largo del tiempo y segmentos de clientes
Edad del cliente Tasa de abandono Q1 Tasa de abandono Q2
18-29 29% 41%
30-49 28% 30%
50-64 24% 25%
65 años o más 20% 19%

Este análisis nos informaría de que las tasas de abandono parecen permanecer estables entre los clientes de 50 años o más. Por otra parte, los clientes más jóvenes parecen más propensos al abandono, y esta tendencia ha aumentado en el 2T. Los sistemas clásicos de BI nos permitirían analizar estos datos a través de muchas variables para averiguar qué está pasando.

En muchos casos, una empresa podría encontrar patrones valiosos que condujeran a acciones o decisiones manuales sólo mediante este tipo de análisis. Por eso esta etapa sigue siendo tan crucial y siempre seguirá siendo muy importante.

El análisis predictivo lleva el análisis un paso más allá y responde a una única pregunta: ¿qué ocurrirá en el futuro, dado que se repiten todos los patrones que conocemos del pasado? Por tanto, el análisis predictivo añade otro nivel de valor y complejidad a los datos, como puedes ver en la Tabla 1-3.

Tabla 1-3. Estimación de la probabilidad de pérdida de clientes (análisis predictivo)
Identificación del cliente Edad Plan Precio Meses activos Probabilidad de abandono
12345 24 A $9.95 13 87%
12346 23 B $19.95 1 95%
12347 45 B $19.95 54 30%

La complejidad se añade cuando salimos del ámbito de los datos históricos. En lugar de proporcionar información en términos binarios de verdadero o falso, ahora introducimos probabilidades de que ocurran determinados acontecimientos (probabilidad de rotación). Al mismo tiempo, añadimos valor porque incorporamos todo lo que sabemos del pasado a hipótesis sobre cómo influirá en el comportamiento futuro.

Por ejemplo, basándonos en la probabilidad de rotación futura y en los datos históricos de ventas, podemos calcular una previsión del riesgo de ventas de la empresa en los próximos trimestres, que se incorpora a nuestra planificación financiera. O podríamos seleccionar a los clientes con alta probabilidad de abandono para tomar medidas específicas que mitiguen el riesgo de abandono.

Pero, ¿qué acciones debemos emprender? Bienvenido a ¡análisis prescriptivo! La Tabla 1-4 muestra cómo podría verse esto en la práctica. En este caso, añadimos otra dimensión, la siguiente mejor oferta, que incluye una acción recomendada, como un descuento específico o una mejora del producto, en función del perfil individual del cliente y de su comportamiento histórico de compra.

Tabla 1-4. Sugerir acciones (análisis prescriptivo)
Identificación del cliente Edad Plan Precio Meses transcurridos Probabilidad de abandono Siguiente mejor oferta
12345 24 A $9.95 13 87% Oferta de contrato anual
12346 23 B $19.95 1 95% Actualiza
12347 45 B $19.95 54 30% Ninguno

Cuando nos adentramos en organizaciones con miles o más clientes, queda claro que para optimizar estas tareas desde una perspectiva macro, necesitamos apoyarnos en la automatización a nivel micro. Es sencillamente imposible pasar manualmente por todas estas minidecisiones y monitorear la eficacia de nuestras acciones para cada cliente. El retorno de la inversión (ROI) de estas minidecisiones es demasiado bajo para justificar el esfuerzo manual.

Y aquí es donde la IA y el BI van perfectamente de la mano. Considera que la IA puede indicar la probabilidad de rotación junto con una sugerencia de la siguiente mejor acción para cada cliente. Ahora podemos mezclar esta información con las métricas clásicas de BI, como los ingresos históricos del cliente o su fidelidad, lo que nos permite tomar una decisión informada sobre las acciones que tienen el mayor impacto empresarial y las mejores probabilidades de éxito.

Por tanto, la relación entre IA y BI puede resumirse perfectamente en la siguiente fórmula:

  • Inteligencia Artificial + Inteligencia de Negocio = Inteligencia de Decisión

La aplicación de BI impulsada por IA más eficaz es la que combina la toma de decisiones automatizada y la humana. Exploraremos esto de forma práctica en la Parte 2. Ahora, veamos concretamente cómo la IA puede ayudarnos sistemáticamente a mejorar nuestro BI.

Casos comunes de uso de la IA para el BI

IA normalmente puede añadir valor al BI de tres formas:

  • Automatizar los conocimientos y facilitar el proceso analítico

  • Calcular mejores previsiones y pronósticos

  • Permitir que los sistemas de BI obtengan información incluso de fuentes de datos no estructuradas

La Figura 1-3 ofrece a una visión general de alto nivel de cómo estas áreas de aplicación se corresponden con los distintos métodos analíticos.

How AI capabilities support analytical methods
Figura 1-3. Cómo apoyan las capacidades de IA a los métodos analíticos

Exploremos estas áreas con un poco más de detalle.

Automatización y facilidad de uso

Hacer la propia herramienta de BI más inteligente y fácil de usar la hará aún más accesible a los usuarios no técnicos, reduciendo la carga de trabajo de los analistas. Esta facilidad de uso suele conseguirse mediante la automatización interna.

Los algoritmos inteligentes permiten cribar montañas de datos en cuestión de segundos y proporcionar a los usuarios o analistas empresariales patrones o perspectivas interesantes. Como muestra la Figura 1-4, estas rutinas son especialmente adecuadas para las fases de análisis descriptivo y diagnóstico.

La IA puede ayudar a descubrir correlaciones interesantes u observaciones inusuales entre muchas variables que, de otro modo, los humanos pasarían por alto. En muchos casos, la IA también es más capaz de observar combinaciones de métricas que los humanos, que pueden centrarse en una métrica cada vez. Pero la automatización y la facilidad de uso también afectan a la fase de análisis predictivo, por ejemplo, facilitando aún más a los usuarios el entrenamiento y la implementación de modelos ML personalizados.

AI-powered BI: automation and ease of use (application layer)
Figura 1-4. BI potenciado por IA: automatización y facilidad de uso (capa de aplicación)

Hay algo importante que señalar aquí: las capacidades de IA en esta fase suelen estar integradas en la capa de aplicación, que es tu software de BI. Así que normalmente no puedes añadir estas capacidades a una plataforma de BI con unas pocas líneas de código Python (en contraste con las predicciones impulsadas por IA y el desbloqueo de datos no estructurados, que tratamos en los Capítulos 7, 8 y 9). Si utilizas plataformas de BI modernas, como Microsoft Power BI o Tableau, encontrarás estas funciones habilitadas para la IA dentro de estas herramientas. A veces están ocultas o se producen con tanta fluidez que ni siquiera te das cuenta de que la IA está actuando.

El resto de esta sección describe los indicadores de que la IA está trabajando bajo el capó para hacer tu vida de analista mucho más fácil.

Utilizar el procesamiento del lenguaje natural para interactuar con los datos

Al utilizar las tecnologías de procesamiento del lenguaje natural (PLN) de potenciadas por la IA, las máquinas interpretan y procesan mucho mejor las entradas textuales de los usuarios. Por ejemplo, supongamos que quieres conocer los resultados de ventas del mes pasado o las ventas en Estados Unidos del año pasado comparadas con las de este año. Podrías teclear las siguientes consultas

How were my sales in Texas in the last 5 years?

o

Sales $ in Texas last year vs Sales $ in Texas this year

No se necesita código ni lenguaje de consulta complicados. Esta capa de entrada similar a las preguntas y respuestas hace que el BI sea mucho más accesible para los usuarios no técnicos, así como más cómodo para los analistas, que realmente no pueden anticiparse a todas las preguntas que un usuario empresarial podría hacer con un informe prefabricado. La mayoría de los usuarios estarán bastante familiarizados con este enfoque, porque es similar al uso de un motor de búsqueda como Google.

Tanto si las herramientas de Preguntas y Respuestas están integradas en tu herramienta de BI como si no, no todas estas implementaciones funcionan igual de bien. De hecho, hay que resolver una enorme complejidad entre bastidores para que estas funciones funcionen de forma fiable en entornos de producción. Los analistas tienen que rastrear los tipos de preguntas que hacen los usuarios empresariales y validar que la salida generada es correcta. Hay que definir los sinónimos y la jerga específica del dominio para asegurarse de que los sistemas puedan interpretar correctamente las preguntas de los usuarios. Y como ocurre con todos los sistemas informáticos, estas cosas necesitan un mantenimiento constante. La esperanza es que los sistemas mejoren y el esfuerzo manual necesario en segundo plano disminuya con el tiempo.

Resumir los resultados analíticos

Incluso si un gráfico parece autoexplicativo, es una buena práctica resumir las ideas clave en una o dos líneas de lenguaje natural, reduciendo el riesgo de malas interpretaciones. Pero, ¿a quién le gusta escribir descripciones aparentemente obvias debajo de los gráficos en informes o presentaciones? A la mayoría de la gente no, y ahí es donde la IA puede ayudar.

La PNL potenciada por IA no sólo te ayuda a interpretar la entrada de lenguaje natural, sino que también te genera textos resumidos basados en los datos. Estos textos autogenerados incluirán características descriptivas sobre los datos, así como cambios o rachas destacables. Aquí tienes un ejemplo de un título de gráfico autogenerado de Power BI:

Sales $ for Texas increased for the last 5 years on record and it experienced the longest period of growth in Sales between 2010 and 2014.

Como puedes ver, estos pequeños fragmentos de texto generados por la IA pueden facilitarte mucho la vida como analista y ahorrarte mucho tiempo a la hora de comunicar ideas a otras partes interesadas. Además, pueden ayudar a cubrir los requisitos de accesibilidad de los lectores de pantalla.

Utilizar la automatización para encontrar patrones en los datos

Has visto en cómo las capacidades de la PNL pueden ayudarte a obtener percepciones descriptivas de tus datos de forma eficaz. El siguiente paso lógico es averiguar por qué ocurrieron ciertas observaciones en el pasado, como por ejemplo, ¿por qué exactamente aumentaron tanto las ventas en Texas?

Con el análisis de diagnóstico, normalmente necesitarías peinar tu conjunto de datos para explorar cambios significativos en las distribuciones de datos subyacentes. En este ejemplo, podrías querer averiguar si un determinado producto o un determinado acontecimiento estaba impulsando el cambio general. Este proceso puede volverse rápidamente tedioso y engorroso. La IA puede ayudarte a reducir el tiempo hasta la comprensión (TTI ).

Los algoritmos son geniales para reconocer patrones subyacentes en los datos y sacarlos a la superficie. Por ejemplo, con herramientas potenciadas por la IA, como los árboles de descomposición o el análisis de influencias clave, puedes averiguar rápidamente sobre la marcha qué característica(s) de tus datos provocó(n) el efecto general observado. En los Capítulos 5 y 6, veremos tres ejemplos concretos de uso de las capacidades potenciadas por IA en Power BI para facilitarte la vida como analista de datos o usuario empresarial.

Mejores previsiones y pronósticos

Aunque los análisis descriptivos y de diagnóstico han estado en el corazón de todos los sistemas de BI, el deseo inminente siempre ha sido no sólo comprender el pasado, sino también prever el futuro. Como puedes ver en la Figura 1-5, las capacidades mejoradas por la IA pueden ayudar a los usuarios finales a aplicar potentes métodos analíticos predictivos y prescriptivos para mejorar las previsiones de y las predicciones de basadas en datos históricos.

Esto añadirá complejidad, ya que abandonamos el ámbito de los datos binarios del pasado e introducimos conjeturas probabilísticas sobre el futuro, que naturalmente contienen muchas incertidumbres. Al mismo tiempo, aumenta el valor prospectivo: si estamos a punto de predecir el futuro, podremos tomar decisiones mucho mejores en el presente.

AI-powered BI: better forecasting and predictions (analytical layer)
Figura 1-5. BI potenciado por IA: mejores previsiones y predicciones (capa analítica)

Ahora bien, tal vez hayas oído hablar antes de métodos estadísticos como la regresión o la media móvil autorregresiva integrada (ARIMA) (quizá en el instituto o en cursos universitarios básicos), y te estés preguntando qué es eso de la IA. Toma nota de los dos aspectos siguientes:

La IA puede producir mejores previsiones con más datos y menos supervisión humana.
La IA aprovecha en su núcleo técnicas de la vieja escuela, como la regresión lineal. Pero al mismo tiempo, la IA puede aplicar estas técnicas a conjuntos de datos complejos utilizando enfoques estocásticos para encontrar rápidamente una solución óptima sin necesidad de una amplia supervisión humana. Los algoritmos especializados en predicciones de series temporales están diseñados para reconocer patrones en grandes cantidades de datos de series temporales. La IA intenta optimizar la predicción basándose en la selección de características y minimizando las funciones de pérdida. Esto puede conducir a predicciones mejores o más precisas utilizando un horizonte temporal corto, o intentando predecir con mayor exactitud durante un periodo de tiempo más largo. Los modelos más complejos y no lineales pueden conducir a resultados de predicción más granulares y, finalmente, mejores.
La IA puede calcular predicciones a escala para optimizar la toma de decisiones.
Hacer una previsión del número total de clientes durante el próximo trimestre está bien. Pero lo que es aún mejor es calcular una probabilidad de abandono para cada cliente de tu base de datos, basándote en datos recientes. Con esta información, no sólo podemos saber qué clientes probablemente abandonarán el próximo mes, sino también optimizar nuestra toma de decisiones. Por ejemplo, podemos determinar, de todos los clientes que se darán de baja el mes que viene, a cuáles debemos dirigir una campaña de marketing. Combinar el ML con el BI crea una propuesta de valor potencialmente enorme para una organización. Y con el avance de técnicas novedosas como el aprendizaje automático de máquinas (AutoML) y la IA como servicio (AIaaS), que exploraremos más a fondo en el Capítulo 3, las organizaciones pueden reducir los cuellos de botella causados por no disponer de suficientes científicos de datos o profesionales del ML para aprovechar estos potenciales de la IA.

Las capacidades de IA para mejorar las previsiones o mejorar las predicciones pueden encontrarse como parte integrante del software de BI existente (capa de aplicación). Estas capacidades también pueden aplicarse de forma independiente, directamente a nivel de base de datos (capa analítica). Esto hace que siempre estén disponibles, independientemente de la herramienta de BI que estés utilizando. Exploramos cómo aplicar estas técnicas en los Capítulos 7 y 8.

Aprovechar los datos no estructurados

Los sistemas de BI suelen trabajar con datos tabulares procedentes de bases de datos relacionales, como los almacenes de datos empresariales. Sin embargo, con el aumento de la digitalización en todos los canales, asistimos a un incremento espectacular del uso de datos no estructurados en forma de texto, imágenes o archivos de audio. Históricamente, estas formas son difíciles de analizar a escala para los usuarios de BI. La IA está aquí para cambiar eso.

La IA puede aumentar la amplitud y profundidad de los datos disponibles y legibles por las máquinas, utilizando tecnologías como la visión por ordenador o la PNL para acceder a nuevas fuentes de datos antes sin explotar. Los datos no estructurados, como archivos de texto sin formato, documentos PDF, imágenes y archivos de audio, pueden convertirse en formatos estructurados que se ajusten a un esquema determinado, como una tabla o un archivo CSV, y luego pueden consumirse y analizarse mediante un sistema de BI. Como esto es algo que ocurre en el nivel de consumo de datos, este proceso acabará afectando a todas las etapas de la plataforma de BI (ver Figura 1-6).

Al incorporar estos archivos a nuestro análisis, podemos obtener aún más información que puede conducir potencialmente a mejores predicciones o a una mejor comprensión de los factores clave. El Capítulo 8 te mostrará ejemplos de cómo funciona esto en la práctica.

AI-powered BI: unlocking unstructured data in the ingestion layer
Figura 1-6. BI potenciado por IA: desbloquear los datos no estructurados en la capa de ingestión

Intuir la IA y el Aprendizaje Automático

Hemos hablado mucho en sobre cómo se puede utilizar la IA con el BI. Pero para crear realmente productos o servicios potenciados por la IA, tenemos que profundizar y comprender qué es la IA y qué es capaz (y qué no) de conseguir.

¿Qué es realmente la IA? Si preguntas a 10 personas, probablemente obtendrás 11 respuestas. Para el transcurso de este libro, es importante tener una idea común de lo que significa realmente este término.

Reconozcamos primero que el término inteligencia artificial no es nuevo. De hecho, el término se remonta a los laboratorios de investigación militar de los años 50. Desde entonces, los investigadores han probado muchos enfoques para lograr el objetivo de que los ordenadores o las máquinas reproduzcan la inteligencia humana. Como muestra la Figura 1-7, desde su creación han surgido dos grandes campos de la IA: la IA general y la IA restringida.

Development of artificial intelligence
Figura 1-7. Desarrollo de la inteligencia artificial

La IA general, o IA fuerte, se refiere a una tecnología que pretende resolver cualquier problema dado que el sistema nunca haya visto o al que nunca haya estado expuesto antes, de forma similar a como funciona el cerebro humano. La IA general sigue siendo un tema de investigación candente, pero aún está muy lejos; los investigadores aún no están seguros de que se alcance algún día.

Por otro lado,la IA estrecha, en, se refiere a una solución bastante específica capaz de resolver un problema único y bien definido para el que ha sido diseñada y sobre el que ha sido entrenada. La IA estrecha ha impulsado todos los avances de la IA que hemos visto en los últimos tiempos, tanto en investigación como en campos prácticos o empresariales.

En el núcleo de la estrecha IA, un enfoque ha destacado en términos de impacto empresarial y avances en el desarrollo: el aprendizaje automático. De hecho, siempre que hablo de IA en este libro, nos fijamos en las soluciones que han sido posibles gracias al ML. Por eso utilizaré indistintamente IA y ML en este libro y consideraré la IA como un término bastante amplio con un significado bastante literal: La IA es una herramienta para construir entidades (aparentemente) inteligentes capaces de resolver tareas específicas, principalmente mediante el ML.

Ahora que la relación entre IA y ML está un poco más clara, hablemos de lo que realmente es el ML. El ML es un paradigma de programación cuyo objetivo es encontrar patrones en los datos para un fin concreto. ML suele tener dos fases: aprendizaje (entrenamiento) e inferencia (también llamada prueba o predicción).

La idea central del ML es encontrar patrones en los datos históricos para resolver una tarea específica, como clasificar las observaciones en categorías, puntuar probabilidades o encontrar similitudes entre elementos. Un caso de uso típico del ML es analizar datos históricos de transacciones de clientes para calcular probabilidades individuales de abandono de clientes. Con la inferencia, nuestro objetivo es calcular una predicción para un nuevo punto de datos dado todo lo que hemos aprendido de los datos históricos.

Para fomentar tu comprensión del ML, vamos a desgranar los componentes básicos de nuestra definición:

Un paradigma de programación

El software tradicional se construye codificando reglas para escribir un programa específico. Si desarrollas un sistema de atención al cliente, inventas toda la lógica que debe suceder después de que un cliente presente un ticket de soporte (por ejemplo, notificar a los agentes de soporte por correo electrónico). Documenta todas las reglas, introdúcelas en tu programa y envía el software.

El ML, sin embargo, invierte este paradigma. En lugar de codificar reglas en un sistema, presentas suficientes ejemplos de entradas y salidas deseadas (etiquetas) y dejas que el algoritmo de ML elabore el conjunto de reglas por ti. Aunque esta configuración es ineficaz para construir un sistema de atención al cliente, funciona muy bien para determinados escenarios en los que las reglas no se conocen o son difíciles de describir. Por ejemplo, si quieres dar prioridad a las solicitudes de atención al cliente basándote en una serie de características como el texto de la solicitud, el tipo de cliente y la fecha de creación de la solicitud, un algoritmo de ML podría crear un modelo de priorización por ti simplemente mirando cómo se han priorizado las solicitudes anteriores. En lugar de elaborar a mano una complicada lógica si-entonces-si, el algoritmo de ML lo resolverá, dada una cierta cantidad de tiempo de cálculo y recursos computacionales.

Búsqueda de patrones en los datos
Para encontrar patrones útiles en los datos, juegan juntos tres conceptos importantes: algoritmo, entrenamiento y modelo. Un modelo de ML es el conjunto de reglas o la función matemática que calculará un valor de salida dada una entrada de datos específica. Piensa en él como una gran pila de sentencias ponderadas si-entonces-si. El algoritmo ML describe el proceso computacional que debe seguir una máquina para llegar a este modelo. Y el término entrenamiento significa iterar muchas veces sobre un conjunto de datos existente para encontrar el mejor modelo posible para este conjunto de datos concreto, que produzca tanto un error de predicción bajo como una buena generalización sobre entradas de datos nuevas y no vistas, de modo que el modelo pueda utilizarse para un fin específico.
Un propósito específico
Las tareas de ML se suelen clasificar según el problema que intentan resolver. Las áreas principales son el aprendizaje supervisado y el no supervisado. Aunque éste no es un libro sobre los fundamentos del ML, los cubrimos con algo más de detalle en el Capítulo 3.

Si tenemos en cuenta todos los componentes, la tarea de un profesional del ML en una situación del mundo real es recopilar tantos datos sobre la situación de interés como sea factible, elegir y ajustar un algoritmo para crear un modelo de la situación y, a continuación, entrenar el modelo para que sea lo suficientemente preciso como para resultar útil.

Una de las mayores ideas erróneas sobre la IA y el ML que suelen tener los líderes empresariales es que la IA y el ML son superdifíciles de implementar. Aunque diseñar y mantener sistemas de ML específicos y de alto rendimiento es una tarea sofisticada, también tenemos que reconocer que la IA se ha comoditizado y comercializado, de modo que incluso los no expertos en ML pueden construir soluciones de ML de buen rendimiento utilizando las bibliotecas de código existentes, o soluciones sin código o de bajo código. En el Capítulo 4, aprenderás más sobre estas técnicas para que puedas implementar soluciones de ML por ti mismo sin la ayuda de científicos de datos o ingenieros de ML.

La IA como término puede asustar e intimidar a la gente que no sabe realmente lo que significa. La verdad es que estamos muy lejos de Terminator y de la IA general. Si quieres conseguir una mayor aceptación y adopción de soluciones de IA dentro de tu organización, tienes que comunicar qué es la IA en un lenguaje amigable y no técnico. Pensar en la IA como en la automatización o en la posibilidad de tomar mejores decisiones basadas en el aprendizaje del pasado debería hacerte sentir lo suficientemente cómodo como para detectar casos de uso potencialmente buenos y compartir ese espíritu con tus compañeros de trabajo.

Mapear las ideas de casos de uso de la IA al impacto empresarial

Ahora que has aprendido más sobre la IA y cómo puede aplicarse al BI, puede que ya tengas algunas ideas en mente para aplicar la IA a tus propios casos de uso. Para averiguar cuáles de ellas tienen más potencial y merece la pena desarrollarlas, echaremos un vistazo a un marco de mapeo de historias que puedes utilizar exactamente para este fin. El marco se inspira en las técnicas ágiles de gestión de proyectos y debería ayudarte a estructurar tu proceso de pensamiento.

La idea central de este marco de mapeo de historias de IA es contrastar la implementación actual de un proceso con una implementación de ese proceso habilitada por la IA. Esta técnica te dará una visión general de alto nivel y de principio a fin de lo que sería diferente, qué cosas tendrías que cambiar y, sobre todo, te ayudará a estructurar tu proceso de pensamiento.

La creación de un guión gráfico es sencilla. Coge un papel en blanco y divídelo en un cuadro con cuatro columnas y dos filas. Las cuatro casillas superiores trazarán tu proceso actual, y las casillas inferiores describirán la aplicación futura, prevista. Nombra las columnas de izquierda a derecha Configuración, Acciones, Resultados. La Figura 1-8 muestra el aspecto que debe tener tu hoja de papel.

Storyboard template
Figura 1-8. Plantilla de guión gráfico

Para crear tu guión gráfico, tienes que rellenar las columnas de izquierda a derecha. Empiezas por la primera fila, en la que se describe cómo funciona la aplicación actual de un proceso determinado según las siguientes dimensiones:

Configurar
Describe cómo se inicia el proceso y enumera tus supuestos, recursos o criterios de partida.
Acciones
Contiene todas las tareas y acciones ejecutadas por o sobre el recurso indicado en la configuración.
Resultados
Describe los artefactos reales del proceso. ¿Qué se genera, crea o modifica exactamente?
Resultados
Contiene los impactos que los resultados tienen en la empresa, y/o los siguientes pasos subsiguientes para los resultados. Por ejemplo, mostrar un informe en un cuadro de mando es un resultado, pero por sí mismo no tiene ningún impacto. El impacto es lo que ocurre a partir de la información mostrada en el cuadro de mando y quién lo hace.

En el siguiente paso, harás lo mismo con la futura implantación prevista. Al final, tendrás una comparación directa entre el enfoque antiguo y el nuevo, lo que te dará más claridad sobre cómo van a cambiar las cosas y el impacto que podrían tener esos cambios. Para dar un poco más de contexto sobre cómo funciona este ejercicio, la Figura 1-9 muestra un guión gráfico de muestra para nuestro caso de uso de la pérdida de clientes.

Storyboard example
Figura 1-9. Ejemplo de guión gráfico

Recorramos nuestro ejemplo de guión gráfico. Empezaremos por la esquina superior izquierda, exponiendo la configuración actual del proceso existente.

Actualmente, la fuga de clientes la detectan los vendedores, que obtienen información de los clientes existentes cuando hablan con ellos en sus reuniones habituales, o los empleados de atención al cliente, que reciben información de los clientes de que algunas cosas no están funcionando como esperaban o de que se enfrentan a otros problemas. En el siguiente paso, el personal de atención al cliente o de ventas intenta resolver el problema directamente con el cliente, por ejemplo, ofreciéndole ayuda para la incorporación.

El principal resultado de este proceso es que el servicio de atención al cliente (con suerte) resuelve los puntos de dolor y los problemas existentes para el cliente. Los puntos de dolor pueden comunicarse a un nivel de gestión o a un sistema de gestión de reclamaciones. Como resultado, es de esperar que el cliente permanezca con el servicio actual una vez resuelto el problema.

Contrastémoslo con una implementación basada en la IA, empezando por la esquina inferior izquierda y siguiendo hacia la derecha. En nuestra configuración, recopilaríamos datos históricos sobre la forma en que los clientes utilizan los distintos productos y servicios, y marcaríamos a los clientes que cambiaron y a los que no cambiaron. También incorporaríamos personal de ventas y atención al cliente para que compartieran su experiencia con el analista.

Nuestra siguiente acción sería analizar los datos históricos para determinar si se pueden identificar en el conjunto de datos los factores clave de la pérdida de clientes. En caso afirmativo, desarrollaríamos un modelo predictivo para calcular el riesgo de abandono individual de cada cliente de nuestra base de datos, así como para proporcionar información sobre los motivos por los que es probable que se produzca el abandono.

Como resultado, se presentarían a la empresa estas puntuaciones de riesgo de abandono y los motivos de abandono. La información podría combinarse con otras métricas, como los ingresos de los clientes, y presentarse en un informe en el sistema de gestión de relaciones con los clientes (CRM) o de BI.

Con esta información, el servicio de atención al cliente podría llegar de forma proactiva a los clientes con un alto riesgo de abandono e intentar resolver el problema o eliminar los obstáculos antes de que el cliente marque un ticket de soporte o abandone sin abrir ningún ticket. Como resultado, la tasa general de rotación debería reducirse con el tiempo, porque la organización puede abordar mejor las razones de la rotación de clientes a escala.

Con ambos storyboards -el proceso existente y el nuevo- deberías sentirte más seguro a la hora de describir cómo podría ser una posible solución de IA, las ventajas que podría aportar y si es incluso razonable optar por el nuevo enfoque, ya sea sustituyéndolo o mezclándolo con el proceso existente. Como ejercicio, utiliza la plantilla del guión gráfico y traza dos o tres ideas de casos de uso de la IA. ¿Cuál de estas ideas te parece más prometedora?

A modo de conclusión, el propósito de un guión gráfico es proporcionar una página sencilla para cada caso de uso que contraste intuitivamente las diferencias y ventajas entre la solución existente y la nueva. Un guión gráfico te ayudará a estructurar tu proceso de pensamiento y es un punto de partida sólido a la hora de priorizar los casos de uso de la IA.

Resumen

En este capítulo, has aprendido cómo la IA está cambiando el panorama del BI, impulsada por las necesidades de los usuarios empresariales de obtener respuestas más rápidas a partir de los datos, la creciente demanda de conocimientos democratizados y una mayor disponibilidad general de herramientas ML comoditizadas. Exploramos exactamente cómo la IA puede ayudar al BI mediante la automatización y una mejor usabilidad, la mejora de las previsiones y el acceso a nuevas fuentes de datos, capacitando así a las personas para tomar mejores decisiones. A estas alturas, deberías tener una comprensión básica de cómo funcionan la IA y el ML y de sus capacidades actuales. También has aprendido a utilizar un marco que puede ayudarte a estructurar tu proceso de pensamiento y a elaborar ideas para casos de uso de ML.

En el próximo capítulo, profundizaremos en cómo se diseñan los sistemas de IA y qué factores debes tener en cuenta antes de implantar estas tecnologías en tus servicios de BI.

Get Inteligencia empresarial basada en IA now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.