Capitolo 1. Introduzione alla Generazione potenziata dal recupero (RAG)
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Immagina un ingegnere di IA che sta creando un semplice chatbot di assistenza interna per la sua azienda. Lo prototipa in un pomeriggio usando GPT-5.1, un modello linguistico di grandi dimensioni (LLM) già pronto all’uso. I primi risultati sembrano impressionanti: il modello conversa in modo fluido, riassume documenti lunghi e redige persino bozze di codice. Ma nel momento in cui le viene chiesto qualcosa che riguarda i sistemi interni dell’azienda — “Quale sarà la politica di rimborso dopo gennaio del prossimo anno?” o “Quali account dei clienti sono contrassegnati per un follow-up questa settimana?” — le risposte crollano. Il modello restituisce con sicurezza un testo che sembra plausibile ma non ha alcun collegamento con i dati reali dell’azienda. A volte inventa politiche obsolete. A volte offre delle vere e proprie assurdità. Il problema principale non è la fluidità del modello, ma la sua cecità.
Questa “ ” è il limite fondamentale anche dei LLMs più avanzati.1 Sono addestrati su enormi corpora — libri, articoli, repository di codice e contenuti web pubblici — che danno loro una comprensione ampia e generalizzata del linguaggio e permettono loro di svolgere compiti per cui non sono mai stati esplicitamente addestrati. Ma per quanto grande sia il set di dati di addestramento, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access