Capítulo 5. Desafíos al implementar LLMs
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hasta ahora, en este libro hemos explicado los conceptos básicos del servicio de modelos, hemos presentado varios patrones arquitectónicos para implementar modelos de ML y hemos analizado las ventajas y desventajas de las implementaciones a gran escala. Esperamos que ya tengas una buena comprensión de los paradigmas del servicio de modelos, porque estamos a punto de dar un gran paso hacia un ámbito diferente. En este capítulo, cambiaremos el enfoque hacia uno de los campos de más rápido crecimiento en el mundo de la IA: la optimización de los LLMs para su implementación.
Desde el auge de ChatGPT a finales de 2022, los LLMs han transformado la forma en que se aplica la IA en escenarios del mundo real, desde chatbots y generación de código hasta sistemas avanzados de razonamiento y toma de decisiones. Sin embargo, su enorme tamaño, sus exigencias computacionales y sus requisitos de servicio únicos plantean desafíos que pueden ir mucho más allá de las técnicas clásicas de servicio de modelos. Desde ideas novedosas hasta marcos ampliamente adoptados, el campo de la optimización de los LLMs para un rendimiento de servicio más rápido y eficiente ha evolucionado a un ritmo sin precedentes. Puede resultar abrumador: cualquiera que no esté familiarizado con esta área puede sentirse fácilmente desbordado. Por ejemplo:
-
Al leer blogs ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access