Skip to Content
Modelli linguistici di grandi dimensioni pratici
book

Modelli linguistici di grandi dimensioni pratici

by Jay Alammar, Maarten Grootendorst
March 2025
Intermediate to advanced
428 pages
11h 23m
Italian
O'Reilly Media, Inc.
Book available
Content preview from Modelli linguistici di grandi dimensioni pratici

Capitolo 3. Guardare all'interno di grandi modelli linguistici

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Ora che abbiamo un'idea della tokenizzazione e degli embeddings, siamo pronti ad approfondire il modello linguistico e a vedere come funziona. In questo capitolo analizzeremo alcune delle principali intuizioni sul funzionamento dei modelli linguistici di Transformer. La nostra attenzione si concentrerà sui modelli di generazione del testo, in modo da ottenere un'idea più approfondita dei LLMs generativi in particolare.

Analizzeremo sia i concetti che alcuni esempi di codice che li dimostrano. Iniziamo caricando un modello di linguaggio e preparandolo per la generazione dichiarando una pipeline. Durante la prima lettura, puoi tranquillamente ignorare il codice e concentrarti sui concetti da comprendere. In una seconda lettura, il codice ti permetterà di iniziare ad applicare questi concetti.

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

# Load model and tokenizer
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=True,
)

# Create a pipeline
generator = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=50,
    do_sample ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Progettazione di applicazioni per modelli linguistici di grandi dimensioni

Progettazione di applicazioni per modelli linguistici di grandi dimensioni

Suhas Pai
Modelli di progettazione dell'IA generativa

Modelli di progettazione dell'IA generativa

Valliappa Lakshmanan, Hannes Hapke
IA generativa pratica con trasformatori e modelli di diffusione

IA generativa pratica con trasformatori e modelli di diffusione

Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker

Publisher Resources

ISBN: 9798341639003Supplemental Content