Capítulo 5. Ajuste y evaluación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 4, aprendiste varias técnicas para ayudar a aumentar el rendimiento de los grandes modelos generativos. También exploraste estrategias eficientes de computación distribuida, como el paralelo de datos distribuidos (DDP) y el paralelo de datos totalmente fragmentados (FSDP), para escalar tus esfuerzos de desarrollo de modelos grandes a través de un conjunto de instancias de computación distribuida. Aunque estas técnicas son esenciales para el preentrenamiento de grandes modelos fundacionales desde cero, también son útiles para adaptar los modelos fundacionales a tus conjuntos de datos y casos de uso personalizados durante un proceso denominado ajuste fino.

En este capítulo, profundizarás en una técnica de ajuste llamada ajuste fino de instrucciones. Ya aprendiste sobre las instrucciones en el Capítulo 2 con el debate sobre la ingeniería de prompts. Las instrucciones son órdenes al modelo para que realice alguna tarea, como "Resumir esta conversación" o "Generar un correo electrónico de marketing personalizado". Al afinar un modelo básico con instrucciones, es importante presentar una mezcla de instrucciones en muchas tareas diferentes para mantener la capacidad del modelo básico de servir como modelo generativo de propósito general.

En este capítulo, conocerás varias métricas de evaluación y puntos de referencia que ...

Get IA Generativa en AWS now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.