Introducción: El cerebro adecuado en el lugar adecuado (Por qué necesitamos IA autónoma)
Aunque los problemas que la industria me ha pedido que resuelva con la IA autónoma son muchos y variados, pueden dividirse, no obstante, en tres categorías claras, que ahora explicaré en detalle.
Hice de consultor para una empresa que utiliza máquinas de control numérico por ordenador (CNC) para fabricar carcasas de teléfonos móviles. Unas herramientas giratorias cortan el metal para darle la forma del teléfono. Una vez cortada cada carcasa, se abre la puerta de la máquina CNC. Un brazo robótico carga la pieza acabada en una cinta transportadora, coge la siguiente pieza de una fijación y la carga en la máquina CNC para cortarla. Si la pieza no se orienta en la fijación precisamente en el ángulo correcto, el brazo robótico no podrá agarrar la pieza o la dejará caer antes de que llegue a la máquina CNC. Y si la caja que llega es más ancha o más fina de lo esperado, aunque sólo sea un poco, el brazo robótico volverá a no agarrar la pieza o la dejará caer antes de que llegue a la máquina CNC.
El sistema automatizado es inflexible. Un sistema automatizado es aquel que toma decisiones mediante cálculos, búsquedas o consultas. El controlador del brazo del robot se programó a mano para que se desplazara de un punto fijo a otro y realizara la tarea de una forma muy concreta. Sólo tiene éxito si la carcasa del teléfono tiene la anchura perfecta y se asienta en la fijación en el ángulo perfecto, como se muestra en la Figura I-1.
Esta organización necesita una automatización más flexible y adaptable que pueda controlar el brazo robótico para agarrar con éxito cajas de una gran variedad de anchuras desde una serie de orientaciones de fijación. Esta es una gran aplicación para la IA autónoma. La IA autónoma es flexible y se adapta a lo que percibe. Por ejemplo, puede practicar el agarre de cajas de distintas anchuras que se encuentran en la fijación en distintos ángulos y aprende a tener éxito en una mayor variedad de escenarios, como se muestra en la Figura I-2.
El mundo cambiante requiere habilidades de adaptación
Un ejecutivo de una empresa siderúrgica mundial me pidió que viajara a Indiana para examinar parte de su operación de fabricación de acero, determinar dónde podría ayudar un cerebro de IA y diseñar ese cerebro. Llegamos a la acería a primera hora de la mañana y nos reunimos con el CTO de la planta, que nos dirigió al edificio que albergaba el proceso en el que quería que nos centráramos y nos dio algunas indicaciones, luego nos pusimos zapatos protectores, cascos y manguitos metálicos y entramos para hacer una visita guiada. El capataz salió a nuestro encuentro y nos llevó a recorrer un "edificio" en el que cabían muchos edificios altos y que tenía muchas manzanas de ancho y de largo (véase la Figura I-3). Ésta era la última fase del proceso de fabricación del acero, en la que se enrolla una tira de acero entre lo que parecen dos rollos de toalla de papel, luego se envía a través de un horno para templarla y finalmente a través de un baño de zinc fundido para protegerla de la oxidación (esto se llama "galvanización").
Hablamos con el operador de cada sala de control (en las acerías se llaman "púlpitos"). Les entrevisté sobre cómo toman las decisiones para hacer funcionar las máquinas (qué información utilizan para tomar la decisión y cómo hacen funcionar las máquinas de forma diferente en distintos escenarios). Después, mis anfitriones me llevaron a un centro de investigación, donde presenté mis recomendaciones al director digital (CDO) y a un grupo de investigadores sobre qué decisiones de la fábrica podían mejorarse utilizando IA. Recomendé implicar a la IA en la galvanización, el último paso del proceso.
Los operarios controlan el equipo de recubrimiento en tiempo real para asegurarse de que el recubrimiento de zinc sea uniforme y tenga el grosor correcto. Este trabajo solía ser mucho más fácil cuando la planta fabricaba la mayor parte de su acero con el mismo grosor, la misma anchura y el mismo grosor de recubrimiento para los tres grandes fabricantes de automóviles estadounidenses. Ahora hay muchos más clientes que piden muchos espesores y anchuras diferentes de acero para conductos de calefacción, construcción y todo tipo de cosas. A los operarios les costaba mantener el revestimiento uniforme y el grosor correcto en todas estas variaciones. Algunos clientes pedían acero ancho y fino con un revestimiento fino; otros, acero estrecho y grueso con un revestimiento grueso. El mundo de la fabricación de acero había cambiado y esta empresa buscaba soluciones en la IA autónoma.
Esta empresa se enfrenta a una situación difícil. Sus entornos empresariales (clientes, mercados, procesos, equipos y trabajadores) están cambiando y se esfuerzan por adaptar su toma de decisiones. A menudo, sus sistemas automatizados, que se construyeron para automatizar procesos repetibles y predecibles, no pueden cambiar su comportamiento programado en respuesta a estos entornos cambiantes. A medida que cambian las condiciones, toman peores decisiones y, a veces, son retirados del servicio por completo porque sus decisiones ya no son relevantes o no tienen la calidad suficiente.
Los problemas necesitan soluciones, no IA
Los humanos y los sistemas automatizados están llegando al límite de las mejoras que pueden introducir en los procesos industriales. Ahora, las empresas recurren a la IA en busca de respuestas. Desgraciadamente, gran parte del debate sobre la IA se centra en la IA como ficción (capacidad sobredimensionada y sobreprometida) o ciencia ficción (si la IA alcanzará alguna vez la superinteligencia y, si lo hace, cuáles son las implicaciones filosóficas y éticas). Ninguno de estos debates ayuda a las organizaciones a mejorar sus operaciones. Lo que las empresas necesitan, en cambio, es un libro de jugadas sobre cómo diseñar una IA útil en sistemas autónomos en los que pueda tomar decisiones con más eficacia que los humanos o los sistemas automatizados.
Cuando empecé a diseñar IA autónoma, presenté "una nueva forma de IA" que era diferente de otros tipos de IA y aprendizaje automático. Rápidamente me di cuenta de que a las empresas a las que consultaba no les importaba la IA. Buscaban una tecnología que tuviera capacidades únicas para controlar y optimizar bien sus procesos empresariales de alto riesgo en comparación con sus soluciones existentes. Les importaba que sus operadores y sistemas de control automatizados fueran eficaces, pero les costaba ofrecer una mejora adicional de los procesos. Comprendieron que la tecnología de control y optimización siempre está evolucionando y que la IA autónoma no es más que una evolución de la tecnología de control y optimización con características diferenciadoras únicas.
¿Qué puede hacer la IA por mí en la vida real?
El Informe sobre el Índice de IA cita que en 2019 se publicaron más de 120.000 artículos académicos revisados por pares relacionados con la IA. No pocos de estos artículos tuvieron una gran repercusión en la prensa. Algunos llaman a esto el "conducto de la investigación a las relaciones públicas", por la forma en que las empresas trasladan los avances de la investigación directamente del laboratorio a los anuncios de prensa. Aunque es estupendo tener acceso a la investigación de perímetro, esta vía de la investigación a las relaciones públicas puede hacer que parezca que cada nuevo algoritmo está listo para resolver problemas de la vida real. El reto es que las preocupaciones sobre las personas y los procesos, combinadas con las incertidumbres de los procesos de producción de la vida real, hacen que muchos algoritmos que parecen muy prometedores en experimentos controlados de laboratorio sean prácticamente inútiles. Te pondré un ejemplo.
Una importante empresa estadounidense de alquiler de coches acudió a nosotros para preguntarnos si la IA podía ayudarles a programar la entrega diaria de coches entre sus centros. Cada día, en la mayoría de las grandes ciudades, una docena de conductores transportan los coches desde el punto de alquiler donde se han dejado hasta los lugares donde se necesitan para recogerlos. Un programador humano planifica las rutas de cada conductor, para entregar los vehículos correctos en el lugar adecuado. Quienes estén familiarizados con el campo de la investigación operativa, muy activo en la resolución de problemas de logística y entrega, podrían llamar a esto el "Problema de las Rutas de Vehículos". Entonces, podrían decirte que existen varios algoritmos de optimización que pueden buscar y encontrar la solución "óptima" de rutas para cada conductor, de modo que juntos, los conductores recorran la distancia más corta. Entonces, ¿cuál es el problema? ¿Por qué esta empresa utiliza programadores humanos? ¿No conocen el algoritmo de Dijkstra para encontrar rutas que recorran la distancia total más corta? Espera un momento. No es tan sencillo.
El algoritmo del camino más corto de Dijkstra busca posibles rutas y programa rutas para cada conductor que sitúen cada parada lo más cerca posible. Por tanto, si estás en una ciudad donde la mejor política es programar siempre cada parada lo más cerca posible, el algoritmo de Dijkstra te dará siempre la mejor respuesta posible. He aquí el problema. En la mayoría de las ciudades metropolitanas, el factor determinante del tiempo que tarda cada tramo del viaje es el tráfico, no la distancia. Pero la investigación operativa define el problema del encaminamiento de vehículos sin tener en cuenta el tráfico. Hay muchas situaciones en las que la mejor parada siguiente no es la más cercana debido a las malas condiciones del tráfico. Esto es especialmente cierto en las horas punta. Cada ciudad tiene patrones de tráfico únicos, pero el tráfico varía en función de una serie de factores. El algoritmo de Dijkstra no tiene en cuenta el tráfico en absoluto y no cambia su comportamiento de programación en función de ninguno de los factores que dictan los patrones de tráfico. Por tanto, aunque todas las empresas de alquiler de coches supieran programar y utilizar el algoritmo de Dijkstra, no sustituiría eficazmente a los programadores de rutas humanos. El algoritmo de Dijkstra también tiene una capacidad limitada para formar a programadores inexpertos o aumentar la experiencia de los programadores experimentados.
En su lugar, he aquí un cerebro que podría adaptarse a los patrones de tráfico mejor que el algoritmo de Dijkstra. Este cerebro también puede utilizarse para entrenar a programadores inexpertos o aconsejar a programadores experimentados. La Figura I-4 es un ejemplo hipotético de cerebro de IA, no uno que se haya diseñado para una empresa real, pero utilizando las técnicas de este libro, puedes diseñar fácilmente cerebros similares y modificar este diseño de cerebro para aplicaciones similares.
El ejemplo de cerebro de la Figura I-4 funciona como un despacho de taxis. Cada vez que un conductor llega entregando un coche, decide a qué ubicación debe entregar su siguiente coche. El objetivo es entregar todos los coches en los lugares donde se necesitan en el menor tiempo posible.
He aquí cómo leer el diagrama de diseño del cerebro. Los óvalos representan la entrada y la salida del cerebro. El cerebro recibe información sobre el tráfico, los vehículos que hay que entregar y los lugares de entrega. Por ejemplo, a través de su nodo de entrada, el cerebro puede recibir información de que es miércoles durante la hora punta matutina, que hasta ahora se han entregado 5 coches y que hasta ahora hay 98 coches pendientes de entrega en el día. Los módulos representan habilidades que el cerebro aprende para tomar decisiones de programación. Diseñamos un módulo de aprendizaje automático en el cerebro (representado por un hexágono) para predecir la duración del viaje a cada destino posible basándonos en los patrones de tráfico de la ciudad. Este módulo funciona de forma muy parecida a los algoritmos de Google y Apple Maps que predicen la duración de cada viaje. El rectángulo representa un módulo de toma de decisiones de IA que determina el destino al que debe dirigirse el conductor. Consulta "Lenguaje visual del diseño cerebral" para más detalles sobre cómo representamos visualmente los diseños cerebrales. El cerebro aprende a tomar decisiones de programación que se adaptan mejor a los patrones de tráfico y crean programaciones que entregan el establo diario de coches más rápidamente que el algoritmo de Dijkstra.
Este ejemplo no sugiere que los algoritmos de software no sean útiles para resolver problemas de la vida real. Es una advertencia contra la elección de un algoritmo de software o una técnica demostrada en investigación de una lista y su aplicación para resolver un problema del mundo real sin tener en cuenta todos los requisitos para una solución a ese problema. Antes he planteado la pregunta: "¿Por qué el software no ha resuelto más problemas en la fabricación?". Mi respuesta es que si eliges de una "lista de algoritmos de software" sin comprender a fondo las operaciones y los procesos que intentas mejorar, no podrás resolver bien los problemas de la vida real.
Consejo
En lugar de simplificar los procesos de toma de decisiones hasta que un algoritmo concreto pueda tomar bien una decisión, añade matices a su capacidad de decisión hasta que pueda resolver bien el problema realista.
La toma de decisiones con IA es cada vez más autónoma
En su libro de 1970 La estructura de las revoluciones científicas (University of Chicago Press), Thomas Kuhn describe los avances de la investigación como la puntuación entre largos periodos de mejora y experimentación incrementales. Por ejemplo, en 1687 Sir Isaac Newton hizo un importante descubrimiento sobre la gravedad. En 1915, Albert Einstein realizó avances que proporcionaron una imagen más matizada y precisa de la gravedad. El avance de Einstein no contradice la Ley de Newton, pero proporciona una visión más completa y matizada del funcionamiento de la gravedad. Del mismo modo, los saltos cuánticos en la capacidad autónoma de toma de decisiones marcan largos periodos de mejora incremental y experimentación dentro de los paradigmas establecidos. Stephen Jay Gould observa el mismo fenómeno en su debate sobre el equilibrio puntuado.1 La Figura I-5 ilustra cómo las revoluciones científicas y la democratización de la corriente dominante hacen avanzar la ciencia a lo largo del tiempo.
A lo largo de la historia de la IA y de otras tecnologías de investigación, estos periodos de resolución de enigmas y de cambios graduales entre los avances de la investigación han añadido capacidades de toma de decisiones más matizadas que se desprenden de la investigación y resultan útiles para resolver problemas reales en la industria. El motor del caza a reacción se desarrolló en los laboratorios de investigación alemanes durante la Segunda Guerra Mundial y se utilizó por primera vez en un caza de producción, el Messerschmitt Me 262. La guerra impulsó la innovación de los aviones a reacción, que se incorporaron a los aviones comerciales durante años después de la Segunda Guerra Mundial.
Lo mismo ocurre con la IA y las tecnologías relacionadas con la automatización. Tomemos como ejemplo el sistema experto: un método para tomar decisiones automatizadas basadas en la experiencia humana. Los sistemas expertos se desarrollaron durante la segunda gran oleada de investigación en IA (1975-1982). Los sistemas expertos son excelentes para captar el conocimiento existente sobre cómo realizar tareas, pero resultaron ser inflexibles y difíciles de mantener. En un momento dado, los sistemas expertos (que algunos pensaban que alcanzarían una inteligencia comparable a la humana) constituyeron gran parte de lo que entonces se consideraba investigación en IA, pero en la década de 1990 prácticamente habían desaparecido de los esfuerzos de investigación en IA. Si bien es cierto que la mayoría de las cuestiones fundamentales de la investigación sobre sistemas expertos se habían respondido en esa época, los sistemas expertos no habían proporcionado la autonomía prevista. Simultáneamente, el periodo de la resolución de puzzles empezó a generalizar y democratizar los sistemas expertos en la automatización de la toma de decisiones útiles para los sistemas reales, al tiempo que se iniciaban trabajos que condujeron a nuevas revoluciones que abordaban los puntos débiles de los sistemas expertos para la toma de decisiones autónoma.
Los sistemas expertos se utilizan mucho hoy en día en finanzas e ingeniería. La NASA desarrolló un lenguaje de software para escribirlos en 1980. En este libro, te mostraré cómo combinar los sistemas expertos con otras técnicas de IA al diseñar la IA autónoma. La primera conclusión es que los avances de la investigación a menudo no están listos para añadir valor a los sistemas y procesos de producción hasta que maduran para satisfacer las preocupaciones de las personas y los procesos de quienes los dirigen. La segunda conclusión es que las nuevas revoluciones seguirán mejorando la toma de decisiones autónoma.
Una de estas revoluciones es el aprendizaje automático, definido en el artículo enlazado de Wikipedia en el momento de escribir este libro como el estudio de algoritmos informáticos que pueden mejorar automáticamente mediante la experiencia y el uso de datos. El aprendizaje automático es un poderoso paradigma para la predicción y la toma de decisiones prescriptivas, y un elemento fundamental para la IA autónoma moderna que trataré ampliamente en este libro. Sin embargo, no sustituye a todos los paradigmas precedentes de toma de decisiones. El aprendizaje automático es a los paradigmas anteriores de toma de decisiones lo que la teoría de la relatividad de Einstein es a la física newtoniana: La física newtoniana se aplica cuando se observan objetos de cierto tamaño que viajan a ciertas velocidades. La relatividad es un paradigma más matizado que se aplica a situaciones en las que la física newtoniana no describe bien la realidad. Descartar los paradigmas anteriores de toma de decisiones en favor del aprendizaje automático conduce a un fenómeno que yo llamo colonialismo de la ciencia de datos.
Cuidado con el colonialismo de la ciencia de datos
Del mismo modo que el software no ha resuelto más problemas en la fabricación, parece que el floreciente campo de la ciencia de datos tampoco ha producido el efecto positivo arrollador previsto en la industria. La ciencia de los datos, utilizando de nuevo una definición del artículo de Wikipedia enlazado, es un campo interdisciplinar que utiliza métodos, procesos, algoritmos y sistemas científicos para extraer conocimientos y perspectivas de datos ruidosos, estructurados y no estructurados, y para aplicar conocimientos y perspectivas procesables de los datos en una amplia gama de dominios de aplicación. El campo está en auge, y las empresas recurren a los científicos de datos para resolver una amplia gama de problemas. Pero, por desgracia, como informa VentureBeat, el 87% de los modelos de aprendizaje automático que crean los científicos de datos nunca llegan a la fase de producción. El colonialismo de la ciencia de datos es una práctica que consiste en utilizar sólo los datos para dictar cómo controlar un sistema u optimizar un proceso, sin comprender suficientemente el proceso. Ignora la experiencia previa en el control de un proceso y la experiencia de ingeniería adquirida al diseñarlo. A veces incluso ignora las leyes físicas y químicas que rigen el proceso. El colonialismo de la ciencia de datos ignora detalles importantes y condesciende con los expertos que deberían participar en el diseño y la construcción de la IA autónoma.
Hay un tipo de ciencia de datos que funciona muy parecido al colonialismo. El colonialismo es una práctica en la que los países exploran o incluso invaden otros territorios alegando intenciones de mejorar las sociedades que encuentran, normalmente sin tener en cuenta la cultura y los valores existentes. Una mentalidad colonialista podría preguntarse: "¿Por qué tendría que consultar a una sociedad más primitiva sobre qué ayuda necesitan de mí? Debería limitarme a decirles lo que tienen que hacer". Ésa es una de las perspectivas más atroces del colonialismo: la arrogancia de que no necesitas aprender ni tener en cuenta nada sobre el pueblo cuya cultura y modo de vida estás destruyendo. Por desgracia, veo una perspectiva similar entre algunos profesionales equivocados de la ciencia de datos que no ven la necesidad de frenar, escuchar y aprender sobre el proceso de las personas antes de intentar diseñar una solución "superior".
Estaba en Canadá, en una gran mina de níquel, consultando a expertos en procesos sobre el uso de la IA para controlar un molino SAG (piensa en una hormigonera de ocho pisos de altura). Salí para atender una llamada telefónica y, cuando volví por el pasillo, me encontré a uno de los científicos de datos discutiendo con uno de los expertos. No era nada que los profesionales no puedan resolver juntos, pero el desacuerdo era sobre si debíamos confiar y respetar los conocimientos de los operarios sobre elfuncionamiento del molino.
En otra ocasión, hablé con un ejecutivo que tenía un título superior en IA y supervisaba la optimización de procesos en una empresa manufacturera. Le expliqué que mi enfoque del diseño de la IA para procesos industriales se basa en gran medida en los conocimientos existentes sobre cómo controlar u optimizar el sistema. Me dio las gracias por no ser una de las muchas empresas que han entrado, le dijo que lo único que necesitaban eran algunos de sus datos y que con ellos le construirían un sistema de control basado en IA. No creía que fuera posible ignorar décadas de experiencia humana e idear un sistema de control que funcionara bien y, al mismo tiempo, tuviera en cuenta todas las preocupaciones sobre las personas y los procesos relacionados con el funcionamiento de equipos caros y críticos para la seguridad. Yo tampoco lo creo.
Múltiples empresas han intentado recientemente resolver problemas en la sanidad utilizando algoritmos de aprendizaje automático. Actividades como la lectura de escáneres radiológicos para detectar el cáncer pueden salvar vidas. Sin embargo, algunas empresas han exagerado las capacidades de los algoritmos y han infravalorado la experiencia de los médicos, con resultados decepcionantes. Quizá un mayor respeto por los expertos conduciría a una tecnología mejor y a resultados más sólidos.
He aquí otro ejemplo de colonialismo de la ciencia de datos. ¿Recuerdas la IA de la excavadora de la que te hablé en la introducción? Uno de los expertos en la materia, un ingeniero de control doctorado llamado Francisco, me dio las gracias durante el proceso de diseño de la IA. Se sintió condescendido por otros que le habían consultado sobre la IA en el pasado. ¿Cómo? Francisco era brillante en matemáticas y teoría del control, ¿por qué alguien iba a ser condescendiente con él sobre la IA? Los mejores diseñadores de cerebros son curiosos, humildes y resisten la tentación de considerar que la ciencia de los datos, el aprendizaje automático o la IA sustituyen el valor de la experiencia en la materia.
Esto no quiere decir que todos los científicos de datos crean que su oficio es una panacea; hay científicos de datos que son curiosos y practican una gran empatía. La humildad y la curiosidad para indagar y aprender lo que la gente ya sabe sobre la toma de decisiones recorrerán un largo camino a la hora de diseñar una IA autónoma.
Consejo
Cualquier cerebro de IA que diseñes para tomar decisiones reales para procesos reales debe tener en cuenta el mundo cambiante, la mano de obra cambiante y los problemas acuciantes.
La mano de obra cambiante exige competencias transferidas
Cuando los sistemas de automatización no funcionan bien o no toman buenas decisiones, las fábricas y los procesos vuelven al control humano. Los humanos intervienen para tomar decisiones de alto valor en algunos procesos sólo cuando los sistemas automatizados toman malas decisiones, pero los humanos conservan el control total de otros procesos que no han descubierto cómo automatizar bien. Sin embargo, los expertos se jubilan a un ritmo alarmante y se llevan consigo décadas de conocimientos duramente ganados sobre cómo tomar decisiones industriales. Después de hablar con un experto tras otro y con una empresa tras otra, me di cuenta de que la gente busca en la IA respuestas a sus cambiantes plantillas porque la experiencia es difícil de adquirir e igualmente difícil de mantener. Para colmo, la pericia es relativamente fácil de enseñar, pero requiere mucha práctica.
La experiencia es difícil de adquirir
He visitado una empresa química que fabrica películas de plástico para pantallas de ordenador y otros productos en una extrusora. Una extrusora toma la materia prima (jabón, harina de maíz para alimentos o, en este caso, gránulos de plástico) y la calienta en un tubo metálico con un tornillo giratorio dentro. El tornillo fuerza el material a salir por una hendidura para hacer el plástico. Después, la película de plástico (se parece al Saran Wrap) se estira en ambas direcciones, se enfría y, a veces, se recubre. La sala de control estaba llena de pantallas de ordenador y teclados para comprobar las mediciones y hacer ajustes en tiempo real. ¿Adivinas cuánto tiempo entrena un operario antes de poder "llevar la voz cantante'' en la sala de control como operario superior? Siete años. Muchos operadores cursan programas universitarios de ingeniería química durante ese tiempo. Se necesita mucha práctica para girar los mandos de un proceso hasta que puedas controlarlo bien para distintos productos, con distintas demandas de los clientes, tipos de plástico, tipos de revestimiento y desgaste de la máquina. Y después de que tus expertos sean muy, muy buenos controlando tu proceso, llega el momento de que se jubilen y necesitas una forma de transmitir esta experiencia a otros menos experimentados.
La experiencia es difícil de mantener
Navasota, Texas, es una pequeña ciudad a unas dos horas en coche de Houston. Fui allí para ayudar a una empresa llamada NOV Inc. en sus operaciones de taller mecánico. Llegamos en una camioneta, a un aparcamiento lleno de camionetas y me sentí fuera de lugar porque sólo era una de las dos personas que vi aquel día que no llevaban botas de vaquero. Nuestro patrocinador ejecutivo era un ejecutivo con visión de futuro llamado Ashe Menon, que quería utilizar la IA como herramienta de formación. Muchos temen que la IA le quite el trabajo a la gente, pero él me dijo lo contrario: "Quiero poder contratar a un chaval de 16 años que haya abandonado el instituto, ponerle un cerebro a su lado y que triunfe como maquinista". Quiere aumentar el número de maquinistas humanos con IA autónoma, no sustituirlos.
Nos sentamos en una sala de conferencias industrial sin lujos a tomar un café fuerte y me presentó a un maquinista llamado David. Prefiero hablar de IA en lenguaje sencillo en lugar de utilizar jerga de investigación, así que le expliqué a este maquinista experto de 35 años que una nueva forma de IA puede aprender practicando y recibiendo retroalimentación, igual que él ha hecho durante todos estos años, y que incluso podemos utilizar su valiosa experiencia para enseñar a la IA algunas de las cosas que ya sabe, de modo que mejore más rápidamente a medida que practica.
Verás, cuando David y otros maquinistas expertos controlan las máquinas de corte (les dan instrucciones sobre dónde moverse y a qué velocidad hacer girar la cuchilla), los trabajos de corte se realizan mucho más rápido y con mayor calidad que cuando los maquinistas utilizan software automatizado para generar las instrucciones. David ha practicado el corte de muchos tipos diferentes de piezas utilizando más de 40 marcas y modelos distintos de máquinas. Algunas de las máquinas son nuevas y otras tienen más de 20 años. Todas estas máquinas se comportan de forma muy diferente al cortar metal y David aprendió a sacar el máximo partido de cada máquina manejándola de forma diferente.
NOV y muchas otras empresas quieren capturar y codificar los mejores conocimientos de sus operadores experimentados, cargar esta experiencia en un cerebro de IA y sentar ese cerebro junto a operadores menos experimentados para ayudarles a ponerse al día más rápidamente y a rendir con mayor eficacia. Para ello es necesario entrevistar a los expertos para identificar las habilidades y estrategias que practicaron para tener éxito en una tarea. Entonces podrás diseñar una IA que practique esas mismas habilidades, reciba retroalimentación y aprenda también a tener éxito en la tarea.
Un ejecutivo del sector de los recursos me dijo que sus expertos de 20 y 30 años se están jubilando en grandes grupos y que da la sensación de que su valiosa y duramente luchada experiencia sobre cómo gestionar mejor su empresa está saliendo por la puerta, para no volver jamás. Los humanos podemos aprender a controlar equipos complejos que cambian de formas realmente extrañas, pero se necesita mucho tiempo de práctica para incorporar los matices a nuestra intuición. La mayoría de los operadores expertos me dicen que tardaron años o décadas en aprender a hacer bien su trabajo.
Consejo
Diseñar una IA autónoma te permite empaquetar la experiencia en la IA como unidades ordenadas de habilidad que pueden pasarse a otros humanos, guardarse para más tarde, combinarse de formas nuevas e interesantes o utilizarse para controlar procesos de forma autónoma.
La pericia es fácil de enseñar, pero requiere práctica
Ya sea jugando al ajedrez, aprendiendo un deporte o controlando un proceso en una fábrica, adquirir destreza requiere mucha práctica para comprender los matices de lo que hay que hacer en muchas situaciones complejas. La pericia es compleja y tiene matices situacionales. Los profesores guían esta práctica de modo que conduzca a una adquisición más eficaz de la destreza. Los entrenadores y los profesores hacen esto todo el tiempo cuando presentan (describen) una habilidad y luego piden a los alumnos que la practiquen. Cuando los profesores hacen esto, a menudo tienen una secuencia opinada en la que quieren que se introduzcan y practiquen las habilidades. Si el plan de enseñanza es bueno, acelera el aprendizaje, pero ni siquiera el mejor plan de enseñanza quita importancia a la improvisación situacional y a los matices que el alumno muestra mientras practica (adquiere)las habilidades.
SCG Chemicals forma parte de una empresa centenaria que fabrica plástico. Para un tipo de plástico, inventaron el proceso, aprendieron a hacer funcionar los reactores con eficacia e incluso investigaron química avanzada para simular el proceso. Los operarios practicaron bien el control de los reactores para todos los diferentes productos de plástico que fabrican y para los catalizadores que utilizan para fabricarlos. Una de las primeras preguntas que hice a los expertos fue: "¿Cómo enseñáis a los nuevos operarios esta compleja habilidad de controlar los reactores?". La respuesta fue concisa y fácil de entender: hay dos estrategias principales que enseñamos a todos los operarios (a los operarios de todos los sexos de SCG se les llama operarios).
-
Añade ingredientes hasta que la densidad alcance el intervalo objetivo. Ignora las mediciones del punto de fusión para el proceso mientras utilices esta primera estrategia.
-
Entonces, cuando la densidad del plástico esté en el rango objetivo, pasa a la segunda estrategia. Mientras utilices esta estrategia, ignora la densidad y añade ingredientes hasta que el punto de fusión del plástico alcance la especificación del producto.
Debido a la forma en que funciona la química, si trabajas las estrategias en el orden prescrito, tanto la densidad como el punto de fusión resultarán correctos. Ellos inventaron este proceso, pero ni siquiera tienen toda la química que explica por qué funciona así. Sin embargo, siempre funciona, por lo que SCG Chemicals enseña esta secuencia para las estrategias a sus operarios.
¿Ves cómo la enseñanza de las habilidades es relativamente sencilla para un profesor competente, pero cómo cada habilidad sigue requiriendo mucha práctica? En manos de un buen profesor, estas habilidades son fáciles de esbozar, pero requieren mucha práctica para que se incorporen a tu intuición. Cada minuto, el tablero debe decidir qué cantidad de cada ingrediente (llamados reactivos en química) añadir. Tendrá que añadir menos reactivo cuando la densidad esté cerca del objetivo y más reactivo cuando la temperatura sea más alta. La cantidad dependerá de la variante de plástico que estén fabricando y del catalizador que utilicen para impulsar la reacción.
El ingeniero supervisor, Pitak, escribe recetas personalizadas que los tableros pueden seguir para ejecutar con éxito cada una de las estrategias, aunque aún no hayan practicado lo suficiente para dominar las habilidades. El tablero se apoya en estas recetas rígidas para tener éxito hasta que haya practicado lo suficiente para interiorizar los matices y variaciones.
Aunque todos los operarios conocen las dos estrategias y tienen un procedimiento para utilizarlas, se necesita mucha práctica para modificarlas y adaptarlas a las condiciones cambiantes del proceso. Por ejemplo, un tablero puede añadir reactivos al reactor en cantidades diferentes mientras fabrica un tipo de plástico utilizando un tipo de catalizador, pero puede añadir ingredientes al reactor en cantidades ligeramente diferentes mientras fabrica otro tipo de plástico utilizando un segundo tipo de catalizador. Así pues, Pitak actualiza las recetas a medida que cambian las condiciones.
Esto es muy parecido a lo que ocurre al hornear (al fin y al cabo, hornear es una reacción química compleja). Puede que tu padre te haya enseñado a mezclar la masa mientras añades la primera serie de ingredientes hasta que esté pegajosa y huela a almendras. Esta es la primera estrategia. También puede haberte enseñado que, a continuación, añadas otra serie de ingredientes y amases la masa hasta que esté firme. Ésta es la segunda estrategia. Tu padre te enseñó dos estrategias y cómo secuenciarlas, como se ilustra en la Figura I-6.
Las estrategias son bastante fáciles de enseñar y entender, pero se necesita práctica para dominarlas. Para eso están las recetas. Te dicen exactamente qué cantidad de cada ingrediente debes añadir en cada paso del proceso y te recomiendan cuánto tiempo mezclar y cuánto tiempo amasar. El problema de las recetas (para hornear, fabricar plástico y muchas otras tareas) es que la receta es rígida. Un panadero experto sabe que si hace calor y humedad fuera mezclará durante menos tiempo antes de empezar a amasar, del mismo modo que Pitak sabe que si hace más calor y humedad fuera, el tablero necesitará añadir más reactivos o más catalizador al reactor. Por eso Pitak actualiza las recetas para que el tablero las siga a medida que la temperatura y la humedad cambian con el tiempo. Con mucha más práctica, los panaderos y los tableros ya no necesitan las recetas. Crean sus propias recetas sobre la marcha (los panaderos se basan en el tacto y el olor de la masa, los tableros en la temperatura y la presión del reactor). Por eso mi madre nunca utiliza recetas cuando cocina. Empezó hace décadas con una receta para cada plato, pero ahora, cuando cocina cada plato, ajusta los ingredientes al gusto sobre la marcha. La primera vez que me enseñó a preparar la receta de chili de nuestra familia, seguí las instrucciones "al pie de la letra", ¡pero ahora improviso cuando hago chili igual que ella!
Los Problemas Acuciantes Exigen Habilidades Completamente Nuevas
El cambio climático es un problema social acuciante. Muchas empresas se han comprometido a tomar medidas para frenar el efecto del cambio climático. ¿Hay alguna forma en que la IA pueda ayudar?
Pues bien, menos consumo de energía significa menos necesidad de energía procedente de combustibles fósiles. ¿Sabías que el 50% del consumo energético de los edificios procede de los sistemas de calefacción, refrigeración, aire acondicionado y ventilación (HVAC)? Resulta que ésta es una oportunidad para que la IA marque una diferencia material en el cambio climático. Muchos sistemas comerciales de HVAC, como los que enfrían y calientan los edificios de oficinas, dependen de ingenieros y operadores humanos para afinarlos y controlarlos.
Conducir varias estancias hacia la temperatura adecuada al tiempo que se gestiona cuidadosamente el consumo de energía no es tan fácil ni intuitivo como parece. Gestionar el consumo de energía de un edificio o campus añade varias capas de variabilidad, como los controles de las torres de refrigeración, las bombas de agua y las enfriadoras. Esto se complica aún más por los ocupantes que entran y salen del edificio constantemente a lo largo del día. Hay un patrón en ello (imagina los horarios de los desplazamientos y las condiciones del tráfico), pero son complejos de percibir. El precio de la energía cambia a lo largo del día. Hay horas punta en las que la energía es más cara y horas valle en las que la energía es más barata. Puedes reciclar el aire para ahorrar dinero de la calefacción del aire exterior, pero las normas legales dictan cuánto dióxido de carbono se permite en el edificio, lo que limita tu capacidad de reciclaje. Cada capa de complejidad hace que sea más difícil para un humano comprender cómo afectará cada variable al resultado de un ajuste de control.
Microsoft construyó una IA autónoma para controlar los sistemas de climatización de su Campus Oeste de Redmond. El campus tenía sistemas automatizados, pero esos sistemas no pueden tomar decisiones de supervisión basadas en la ocupación y la temperatura exterior en tiempo real. Mi equipo trabajó con ingenieros mecánicos para diseñar un cerebro que tomara esas decisiones, y el nuevo sistema consume actualmente un 15% menos de energía. Dos años antes, Google probó con éxito una IA que reducía el consumo de energía en los centros de datos en un 40%. Si te preguntas por qué la IA anterior generó más mejoras, es porque los centros de datos son más fáciles de controlar. Tienen menos influencia de factores externos. Los edificios comerciales tienen que hacer frente a cosas como la irradiación solar (la mayor parte del calor de los edificios comerciales procede del sol que incide en las ventanas desde distintos ángulos a distintas horas) y a un gran número de personas que entran y salen constantemente del edificio.
La IA es una herramienta; úsala para el bien
Cada día veo a gente debatiendo en las redes sociales sobre la ética y los peligros de la IA. Aunque estoy de acuerdo en que la ética es importante y en que, como sociedad, debemos tener mucho cuidado con la forma en que abordamos la IA, la única forma de garantizar que la IA se utilice para el bien es diseñar y construir una IA que haga explícitamente cosas útiles y provechosas.
Acabo de terminar de impartir mi primera cohorte de Diseño de Inteligencia Artificial Autónoma a estudiantes de minorías infrarrepresentadas en la ciudad de Nueva York con la Urban Arts Partnership. ¡Qué experiencia tan increíble trabajar con estudiantes universitarios tan enérgicos y con tanto talento!
Como hombre negro que trabaja en la investigación de la IA, siento cada día el peso de la desigualdad de acceso a tecnologías avanzadas como la IA. Si la Cuarta Revolución Industrial puede dotar de superpoderes, enormes riquezas y oportunidades expansivas a quienes la lideren, el acceso desigual a la IA presenta algo así como un sistema de castas calcificadoras: El 4% de los trabajadores de Microsoft y Facebook son negros; el 2,5% de los trabajadores de Google son negros. Menos del 20% de todos los catedráticos de IA son mujeres, el 18% de los principales artículos de investigación en conferencias sobre IA están escritos por mujeres, y sólo el 15% del personal de investigación en IA de Google son mujeres.2
Robert J. Shiller, premio Nobel de Economía 2013, lo dice muy bien:
No puedes esperar a que se queme una casa para contratar un seguro contra incendios. No podemos esperar a que se produzcan trastornos masivos en nuestra sociedad para prepararnos para la Cuarta Revolución Industrial.
Casi todo el mundo tiene un acceso limitado a la tecnología avanzada hasta cierto punto, pero quienes están marginados de formas adicionales, como debido a sus ingresos, raza y capacidad, tienen una probabilidad multiplicativamente menor de experimentar los beneficios de trabajar con IA autónoma.
A partir de los principios y técnicas de este libro, pretendo democratizar aún más el acceso a la IA autónoma con capacidad de decisión y ponerla en manos de los menos representados y los más desfavorecidos como medio para resolver los problemas de la sociedad y el avance económico.
En primer lugar, imagina a un operario de la empresa química de la que hablé antes (la de la extrusora de plástico) no sólo aprendiendo a controlar bien la extrusora, sino diseñando y construyendo IA que llevarán consigo a la sala de control para ayudarles a tomar decisiones. A continuación, imagina un equipo de ajedrecistas del centro de la ciudad de East Oakland, California, todos ellos pertenecientes a minorías, que aprendieran a jugar al ajedrez jugando con y contra una IA autónoma que ellos mismos diseñaran y enseñaran. Nos queda mucho trabajo por hacer para cumplir esta visión, pero el progreso es real y te invito a que utilices tus habilidades diseñando IA autónomas para hacer el bien en áreas que te apasionen.
Get Diseñar IA autónoma now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.