Skip to Content
Prácticas de implementación y optimización de LLM (Spanish Edition)
book

Prácticas de implementación y optimización de LLM (Spanish Edition)

by Chi Wang, Peiheng Hu
May 2026
Intermediate
374 pages
12h 12m
Spanish
O'Reilly Media, Inc.
Content preview from Prácticas de implementación y optimización de LLM (Spanish Edition)

Capítulo 6. Técnicasesenciales de optimización de LLM

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, demostramos la importancia y los retos que supone optimizar los LLMs para su implementación. En los dos próximos capítulos, profundizaremos una por una en cada una de las técnicas críticas de optimización de LLMs para que cuentes con los conocimientos necesarios para decidir cuándo, cómo y por qué utilizarlas según tus necesidades de implementación.

En este capítulo en concreto, nos centraremos en las técnicas esenciales que te ayudarán a comprender la mayoría de los conceptos de optimización y a alcanzar muchos de tus objetivos de optimización. Dejaremos las técnicas más avanzadas y las tendencias del sector para el capítulo 7.

En este capítulo, hablaremos de cómo utilizar:

  • El agrupamiento y la programación de solicitudes para lograr un mejor paralelismo y una mayor utilización de la GPU

  • La optimización de la atención para lograr una mayor eficiencia computacional, reducir los recursos computacionales necesarios y mejorar la gestión de la memoria

  • Compresión de modelos para lograr modelos más pequeños, menos movimiento de memoria y/o menos computación

  • El almacenamiento en caché de prefijos para almacenar y reutilizar prompts anteriores, incluyendo cómo hacerlo de manera eficiente y obtener una alta tasa de aciertos en la caché

Optimizaciones a nivel de agrupación y programación ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Habilidades de UX para la estrategia empresarial (Spanish Edition)

Habilidades de UX para la estrategia empresarial (Spanish Edition)

Torrey Podmajersky, Maya Elise Joseph-Goteiner, Kim Mats Mats
Malla agentica (Spanish Edition)

Malla agentica (Spanish Edition)

Eric Broda, Davis Broda

Publisher Resources

ISBN: 0642572383633