Capítulo 2. Servicio de modelos de lenguajegrandes
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el capítulo anterior, te presentamos el concepto de modelos, el servicio de modelos e es y los paradigmas comunes de servicio. En este capítulo, nos enfocamos en los retos y técnicas específicos que implica el servicio de LLMs.
Una de las barreras más comunes para quienes se inician en el mundo del servicio de modelos es la enorme complejidad de los sistemas de servicio modernos. Con arquitecturas de modelos, algoritmos de entrenamiento y herramientas en rápida evolución, combinadas con capas de infraestructura de producción como monitoreo, escalabilidad, seguridad, pipelines de CI/CD y dependencias de servicio , la experiencia puede volverse abrumadora rápidamente. El resultado es que muchos ingenieros e investigadores pierden el foco y se atascan en los detalles del sistema antes de poder comprender los principios fundamentales.
Para abordar esto, nuestro enfoque es empezar por lo básico. Comenzamos con el código mínimo necesario para implementar un LLM y vamos construyendo a partir de ahí. Esto ayuda a establecer un modelo mental sólido de cómo funciona la generación de tokens y por qué la implementación de LLMs plantea desafíos únicos. A partir de esta base, iremos ampliando gradualmente a temas más avanzados como la arquitectura del sistema, los métodos de optimización del rendimiento y las opciones de ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access