Capitolo 4. Implementazione di RAG in produzione
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Ora che conosci tutti i componenti di una pipeline RAG, sia di base che avanzati, puoi facilmente mettere insieme un ottimo proof of concept (POC). Per un primo POC, di solito si sceglie un caso d'uso che abbia un valore significativo per l'organizzazione, dove l'investimento iniziale è relativamente basso. In questo modo puoi imparare come funziona davvero e capire in prima persona come opera RAG.
Mettere in piedi un proof of concept RAG è davvero divertente. Prendi un potente modello linguistico di grandi dimensioni, lo punti sui tuoi documenti o dati, implementi la similarità vettoriale tra la query e i vettori di embedding dei chunk in un database vettoriale, e voilà: puoi iniziare a porre domande e ottenere risposte reali, basate sul contenuto dei documenti.
Se lo fai come progetto secondario, ci vuole solo una modesta quantità di tempo e impegno. Tuttavia, se il tuo obiettivo è costruire un'applicazione RAG di livello produttivo che sia scalabile, sicura e veloce, e che fornisca un servizio mission-critical alla tua azienda, allora è tutta un'altra storia.
Passare da un POC a un'implementazione a livello di produzione di un'applicazione RAG pone le aziende di fronte a molte sfide che abbracciano i settori tecnico, operativo e organizzativo. Man mano che si scala l'applicazione RAG, spesso ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access