Skip to Content
Modelos de lenguaje grandes prácticos
book

Modelos de lenguaje grandes prácticos

by Jay Alammar, Maarten Grootendorst
March 2025
Intermediate to advanced
428 pages
11h 21m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Modelos de lenguaje grandes prácticos

Capítulo 12. Ajuste de los modelos de generación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, tomaremos un modelo de generación de texto preentrenado y repasaremos el proceso de ajuste fino. Este paso de ajuste fino es clave para producir modelos de alta calidad y una herramienta importante en nuestra caja de herramientas para adaptar un modelo a un comportamiento específico deseado. El ajuste fino nos permite adaptar un modelo a un conjunto de datos o dominio específico.

A lo largo de este capítulo, te guiaremos entre los dos métodos más comunes para el ajuste fino de los modelos de generación de texto, el ajuste fino supervisado y el ajuste de preferencias. Exploraremos el potencial transformador del ajuste fino de los modelos de generación de texto preentrenados para convertirlos en herramientas más eficaces para tu aplicación.

Los Tres Pasos del Entrenamiento LLM: Preentrenamiento, Ajuste Supervisado y Ajuste de Preferencias

Existen tres pasos comunes que conducen a la creación de un LLM de alta calidad:

1. Modelado lingüístico

El primer paso para crear un LLM de alta calidad es preentrenarlo en uno o más conjuntos de datos de texto masivo(Figura 12-1). Durante el entrenamiento, intenta predecir el siguiente token para aprender con precisión las representaciones lingüísticas y semánticas que se encuentran en el texto. Como ya vimos en los Capítulos 3 y 11, esto se llama modelado ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Diseño de aplicaciones de modelos de lenguaje grandes

Diseño de aplicaciones de modelos de lenguaje grandes

Suhas Pai
Sistemas de producción de aprendizaje automático

Sistemas de producción de aprendizaje automático

Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Patrones de diseño de aprendizaje automático

Patrones de diseño de aprendizaje automático

Valliappa Lakshmanan, Sara Robinson, Michael Munn

Publisher Resources

ISBN: 9781098180096Supplemental Content