Skip to Content
Modelos de lenguaje grandes prácticos
book

Modelos de lenguaje grandes prácticos

by Jay Alammar, Maarten Grootendorst
March 2025
Intermediate to advanced
428 pages
11h 21m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Modelos de lenguaje grandes prácticos

Capítulo 3. Mirar dentro de los grandes modelos lingüísticos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Ahora que tenemos una idea de la tokenización y las incrustaciones, estamos listos para sumergirnos más profundamente en el modelo de lenguaje y ver cómo funciona. En este capítulo, veremos algunas de las principales intuiciones sobre el funcionamiento de los modelos de lenguaje Transformer. Nos centraremos en los modelos de generación de texto para tener una idea más profunda de los LLMs generativos en particular.

Veremos tanto los conceptos como algunos ejemplos de código que los demuestran. Empecemos cargando un modelo de lenguaje y preparándolo para la generación declarando una canalización. En tu primera lectura, siéntete libre de saltarte el código y centrarte en comprender los conceptos implicados. Luego, en una segunda lectura, el código te permitirá empezar a aplicar estos conceptos.

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

# Load model and tokenizer
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=True,
)

# Create a pipeline
generator = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=50,
    do_sample=False,
)

Visión general ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Diseño de aplicaciones de modelos de lenguaje grandes

Diseño de aplicaciones de modelos de lenguaje grandes

Suhas Pai
Sistemas de producción de aprendizaje automático

Sistemas de producción de aprendizaje automático

Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Patrones de diseño de aprendizaje automático

Patrones de diseño de aprendizaje automático

Valliappa Lakshmanan, Sara Robinson, Michael Munn

Publisher Resources

ISBN: 9781098180096Supplemental Content