Capitolo 12. Generazione aumentata dal recupero
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel Capitolo 10 abbiamo dimostrato come sia possibile espandere notevolmente le capacità degli LLMs interfacciandoli con dati e software esterni. Nel Capitolo 11 abbiamo introdotto il concetto di embedding-based retrieval, una tecnica fondamentale per recuperare i dati rilevanti dagli archivi di dati in risposta alle query. Armati di queste conoscenze, esploriamo il paradigma applicativo dell'incremento delle LLMs con dati esterni, chiamato retrieval-augmented generation (RAG), in modo olistico.
In questo capitolo, vedremo una visione completa della pipeline RAG, approfondendo tutti i passaggi che compongono un tipico flusso di lavoro di un'applicazione RAG. Esploreremo le varie decisioni coinvolte nell'operatività del RAG, tra cui il tipo di dati che possiamo recuperare, come recuperarli e quando recuperarli. Evidenzieremo come il RAG possa essere utile non solo durante l'inferenza del modello, ma anche durante l'addestramento e la messa a punto del modello. Confronteremo inoltre RAG con altri paradigmi e discuteremo gli scenari in cui RAG brilla rispetto alle alternative o viceversa.
La necessità di RAG
Come introdotto nel Capitolo 10, RAG è un termine generico utilizzato per descrivere una serie di tecniche per l'utilizzo di fonti di dati esterne per aumentare le capacità di un LLM. Ecco ...