Skip to Content
IA Generativa en AWS
book

IA Generativa en AWS

by Chris Fregly, Antje Barth, Shelbee Eigenbrode
September 2024
Intermediate to advanced
312 pages
8h 39m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from IA Generativa en AWS

Capítulo 3. Modelos de cimentación de grandes lenguas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 2, aprendiste a realizar la ingeniería de prompts de y a aprovechar el aprendizaje en contexto utilizando un modelo base existente. En este capítulo, explorarás cómo se entrena un modelo base, incluidos los objetivos de entrenamiento y los conjuntos de datos. Aunque no es habitual entrenar tu propio modelo base desde cero, merece la pena comprender cuánto tiempo, esfuerzo y complejidad se requieren para realizar este proceso de cálculo intensivo.

Entrenar un modelo de lenguaje grande de miles de millones de parámetros desde cero, lo que se denomina preentrenamiento, requiere millones de horas de cálculo en la GPU, billones de tokens de datos y mucha paciencia. En este capítulo, aprenderás las leyes empíricas de escalado descritas en el popular artículo Chinchilla para el preentrenamiento de modelos.1

Al entrenar el modelo BloombergGPT, por ejemplo, los investigadores utilizaron las leyes de escalado de Chinchilla como punto de partida, pero aun así fue necesario mucho ensayo y error, como se explica en el documento BloombergGPT.2 Con un presupuesto de cálculo de 1,3 millones de horas GPU, BloombergGPT se entrenó con un gran clúster distribuido de instancias GPU utilizando Amazon SageMaker.

Nota

Este capítulo se sumerge en profundidad en el preentrenamiento de modelos de fundamentos generativos, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Desarrollo sin servidor en AWS

Desarrollo sin servidor en AWS

Sheen Brisals, Luke Hedger
MongoDB: La Guía Definitiva, 3ª Edición

MongoDB: La Guía Definitiva, 3ª Edición

Shannon Bradshaw, Eoin Brazil, Kristina Chodorow
SQL en una cáscara de nuez, 4ª edición

SQL en una cáscara de nuez, 4ª edición

Kevin Kline, Regina O. Obe, Leo S. Hsu

Publisher Resources

ISBN: 9781098181499Supplemental Content