Capítulo 10. Avances en el servicio de LLM
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Si ha llegado hasta aquí, felicidades por haber recorrido el camino desde la comprensión de los paradigmas de implementación de modelos hasta cómo implementar LLMs de manera eficiente para diferentes casos de uso.
El capítulo final destaca algunos avances emergentes en el servicio de LLM y sirve como guía para tu aprendizaje continuo a medida que las nuevas ideas y técnicas evolucionan rápidamente. Algunas de estas ideas podrían llenar libros enteros, y el progreso en el campo avanza rápidamente. Es un momento emocionante para ser testigo y contribuir a la evolución de los sistemas de inferencia inteligente. Nuestro objetivo aquí es presentar las ideas y los marcos principales para que, al terminar este libro, te sientas preparado para conectar los fundamentos básicos que hemos cubierto con las nuevas ideas que dan forma a la próxima generación de sistemas de implementación de LLM.
En este capítulo, exploraremos:
El almacenamiento en caché semántico y el enrutamiento como mecanismos de alto nivel para una distribución de solicitudes más inteligente y consciente de la semántica
Perfilado del rendimiento para un ajuste fino del rendimiento
Servicio multimodal, a medida que los LLMs basados en texto se expanden hacia los modelos de lenguaje visual (VLM) y otras modalidades
Servicio en el perímetro, que lleva la inferencia ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access