Skip to Content
Modelos de lenguaje grandes prácticos
book

Modelos de lenguaje grandes prácticos

by Jay Alammar, Maarten Grootendorst
March 2025
Intermediate to advanced
428 pages
11h 21m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Modelos de lenguaje grandes prácticos

Capítulo 2. Tokens e Incrustaciones

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Tokens y embeddings son dos de los conceptos centrales del uso de grandes modelos lingüísticos (LLMs). Como hemos visto en el primer capítulo, no sólo son importantes para comprender la historia de la Inteligencia Artificial Lingüística, sino que no podemos tener una idea clara de cómo funcionan los LLMs, cómo se construyen y hacia dónde irán en el futuro sin una buena noción de los tokens y las incrustaciones, como podemos ver en la Figura 2-1.

Figura 2-1. Los modelos lingüísticos tratan el texto en pequeños trozos llamados tokens. Para que el modelo lingüístico calcule el lenguaje, necesita convertir los tokens en representaciones numéricas llamadas incrustaciones.

En este capítulo examinaremos más detenidamente qué son los tokens y los métodos de tokenización utilizados para potenciar los LLMs. Luego nos sumergiremos en el famoso método de incrustación word2vec que precedió a los LLMs modernos y veremos cómo se está extendiendo el concepto de incrustación de tokens para construir sistemas comerciales de recomendación que potencian muchas de las aplicaciones que utilizas. Por último, pasamos de la incrustación de tokens a la incrustación de frases o texto, donde una frase o documento completo puede tener un vector que lo represente, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Diseño de aplicaciones de modelos de lenguaje grandes

Diseño de aplicaciones de modelos de lenguaje grandes

Suhas Pai
Sistemas de producción de aprendizaje automático

Sistemas de producción de aprendizaje automático

Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Patrones de diseño de aprendizaje automático

Patrones de diseño de aprendizaje automático

Valliappa Lakshmanan, Sara Robinson, Michael Munn

Publisher Resources

ISBN: 9781098180096Supplemental Content