Capítulo 1. Introducción a los grandes modelos lingüísticos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La humanidad se encuentra en un punto de inflexión. A partir de 2012, los avances en la construcción de sistemas de IA (utilizando redes neuronales profundas) se aceleraron de tal modo que, a finales de la década, produjeron el primer sistema de software capaz de escribir artículos indiscernibles de los escritos por humanos. Este sistema era un modelo de IA llamado Generative Pre-trained Transformer 2, o GPT-2. 2022 marcó el lanzamiento de ChatGPT, que demostró hasta qué punto esta tecnología estaba llamada a revolucionar la forma en que interactuamos con la tecnología y la información. Alcanzando un millón de usuarios activos en cinco días y luego cien millones en dos meses, la nueva generación de modelos de IA comenzó como chatbots similares a los humanos, pero evolucionó rápidamente hacia un cambio monumental en nuestro enfoque de las tareas comunes, como la traducción, la generación de texto, el resumen y mucho más. Se convirtió en una herramienta inestimable para programadores, educadores e investigadores.
El éxito de ChatGPT no tuvo precedentes y popularizó la investigación sobre la tecnología que había detrás, es decir, los grandes modelos lingüísticos (LLMs). Tanto los modelos públicos como los privados se lanzaron a un ritmo constante, acercándose y, finalmente, alcanzando el rendimiento de ChatGPT. ...