Overview
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
La generazione aumentata dal recupero (RAG) è la strategia ideale per integrare modelli linguistici di grandi dimensioni con le conoscenze specifiche della tua azienda. Tuttavia, il mercato è pieno di pipeline e componenti RAG, il che rende difficile scegliere la soluzione giusta per le esigenze della tua azienda. Questo libro semplifica il processo, offrendo una mappa completa per costruire, perfezionare e scalare applicazioni RAG di livello produttivo.
Gli autori Ofer Mendelevitch e Forrest Bao ti guidano in ogni fase dello sviluppo, dall'ingestione dei dati, gli embeddings e la ricerca vettoriale fino alle tecniche avanzate come il RAG agenziale, il RAG multimodale e il GraphRAG. Ingegneri e architetti impareranno come affrontare le sfide che incontreranno nella realizzazione di applicazioni RAG su scala aziendale: garantire un'elevata precisione con minime allucinazioni, mantenere prestazioni a bassa latenza, salvaguardare la privacy dei dati e fornire risposte trasparenti e spiegabili.
- Stabilisci se costruire RAG da solo o distribuire una piattaforma RAG-as-a-service.
- Costruire uno stack RAG di base che massimizzi le prestazioni e l'efficacia dei costi.
- Misurare le metriche chiave come le allucinazioni, la qualità delle risposte, la latenza e i costi.
- Affrontare le sfide dell'implementazione aziendale, come la conformità ai requisiti di sicurezza e privacy dei dati, la spiegabilità e il design prompt
- Implementare tecniche avanzate come il RAG multimodale, il RAG agenziale e il GraphRAG.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access