Capítulo 9. Flujos de trabajo LLM
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los modelos clásicos de aprendizaje automático solían ser competentes en una sola habilidad de un dominio -análisis del sentimiento de los tweets, detección del fraude de las transacciones de tarjetas de crédito, traducción de texto del inglés al francés, etc.-. Con la llegada de los modelos GPT, un único modelo puede realizar ahora una enorme variedad de tareas de aparentemente cualquier dominio.
Pero aunque la calidad de los modelos ha mejorado enormemente desde la GPT-2, no estamos ni cerca de crear inteligencia general artificial, (AGI), que es una IA que alcanza o supera la cognición de nivel humano. Cuando creemos una AGI, tendrá la capacidad de asimilar conocimientos, razonar sobre ellos, resolver problemas novedosos y complejos e incluso generar nuevos conocimientos. La AGI utilizará una creatividad similar a la humana para abordar problemas del mundo real en cualquier dominio.
Por el contrario, los LLMs actuales muestran marcadas deficiencias en el razonamiento y la resolución de problemas y son especialmente malos en matemáticas, un componente crítico del descubrimiento científico. Los textos que generan demuestran una vasta comprensión de los conocimientos existentes, pero rara vez introducen algo nuevo. Y fuera del entrenamiento, estos modelos son incapaces de aprender nueva información. Las futuras AGI, por definición, ...