Skip to Content
Prácticas de implementación y optimización de LLM (Spanish Edition)
book

Prácticas de implementación y optimización de LLM (Spanish Edition)

by Chi Wang, Peiheng Hu
May 2026
Intermediate
374 pages
12h 12m
Spanish
O'Reilly Media, Inc.
Content preview from Prácticas de implementación y optimización de LLM (Spanish Edition)

Capítulo 8. Marcos de servicio deLLM

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, hemos explorado los fundamentos del servicio de LLM: diseñode sistemas, implementación de servicios y técnicas prácticas de optimización. Este capítulo se centra en la capa base: los marcos de servicio que implementan y ejecutan la inferencia de modelos con diferentes técnicas de optimización bajo restricciones reales de producción. Hablaremos de cuatro marcos de servicio de código abierto muy utilizados con los que probablemente te encontrarás en la práctica: vLLM, TensorRT-LLM, SGLang y llama.cpp. Cada uno tiene una filosofía, un espacio de hardware y una tecnología probada en la práctica distintos, y cuenta con el respaldo de comunidades activas y un uso en producción cada vez mayor.

Dado que es el marco más ampliamente utilizado, analizaremos en profundidad vLLM: su arquitectura, el proceso de inicialización y ejecución de modelos, la programación a nivel de solicitud y de tokens, y la estrategia de optimización por capas. Comprender el funcionamiento interno de vLLM te dará una idea clara de cómo funcionan los marcos LLM en la práctica y te facilitará la evaluación de las ventajas y desventajas de otros marcos.

A continuación, cubriremos los marcos restantes con descripciones concisas y orientadas a la toma de decisiones, además de ejemplos breves. Cerraremos el capítulo con el método de evaluación ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Habilidades de UX para la estrategia empresarial (Spanish Edition)

Habilidades de UX para la estrategia empresarial (Spanish Edition)

Torrey Podmajersky, Maya Elise Joseph-Goteiner, Kim Mats Mats
Malla agentica (Spanish Edition)

Malla agentica (Spanish Edition)

Eric Broda, Davis Broda

Publisher Resources

ISBN: 0642572383633