Capítulo 11. De cara al futuro
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La historia humana sólo tiene sentido en una escala logarítmica. Los humanos tardaron incontables eones en descubrir la agricultura, milenios más en inventar la escritura, siglos más en inventar la máquina de vapor y décadas más en inventar el automóvil, el ordenador y el smartphone. Pocos años después de eso, hacia 2012, apareció en escena el Deep Learning.
El GPT-2 de OpenAI se anunció en en 2019, y luego se anunció el ChatGPT en 2022. Esto desencadenó una explosión de desarrollo en torno a los LLMs. Muchas empresas se han lanzado al ruedo -Anthropic, Google, Microsoft, Meta, xAI, NVIDIA, Mistral y otras-, todas ellas construyendo nuevos LLMs que han superado a los anteriores en capacidad y velocidad. En sólo unos meses, los LLMs han pasado de ser motores de cumplimentación de documentos a motores de chat y agentes capaces de interactuar con el mundo exterior.
Abróchense el cinturón, lectores. Si crees que el ritmo del cambio es rápido ahora, espera, sólo va a ir a más. (¡Quizá ese tal Ray Kurzweil estaba en lo cierto!) En este capítulo final, echemos un vistazo a algunos de los avances que se vislumbran en nuestro horizonte y cómo cambiarán tu trabajo como ingeniero de prompts.
Multimodalidad
Existe un gran impulso hacia el uso de modelos multimodales. OpenAI inició esta tendencia con GPT-4, que era capaz de procesar imágenes ...