Capitolo 10. Il futuro del RAG
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Il RAG è senza dubbio uno degli approcci più efficaci per applicare i LLMs ai dati delle aziende private. Negli ultimi anni, è passato dall’essere una tecnica sperimentale a diventare il modello architettonico standard per le aziende che hanno bisogno di un’esperienza simile a ChatGPT basata sui propri dati, e ora sta passando rapidamente dai POC alle implementazioni in produzione.
Nel corso di questo libro, hai imparato a padroneggiare i pilastri del RAG: LLMs, embedding, archivi vettoriali e reranking. Hai visto come un proof of concept funzionante possa prendere vita nel giro di un solo fine settimana. Ma il vero lavoro di ingegneria inizia proprio nel passaggio da uno script locale a un ecosistema resiliente e pronto per la produzione. Ciò richiede di andare oltre il semplice "funziona" per risolvere problemi di latenza, accuratezza su larga scala e manutenibilità a lungo termine.
Il RAG in produzione non riguarda solo il codice; è un sistema distribuito che richiede una governance e una sicurezza rigorose. Devi gestire l'acquisizione su larga scala, garantendo l'integrità dei dati su terabyte di contenuti multimodali. Ancora più importante, devi implementare una strategia di sicurezza a più livelli, il che significa applicare una redazione sensibile alle entità per ripulire le informazioni di identificazione ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access