Prefazione
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Hai visto la demo di “easy RAG”: poche righe di Python, un database vettoriale e una chiave API. In dieci minuti, il chatbot risponde a domande basate su alcuni file PDF aziendali. Sembra quasi magia.
Forse hai anche fatto il passo successivo nella tua azienda: hai creato un'applicazione RAG (Retrieval-Augmented Generation), l'hai ospitata sulla tua piattaforma Cloud preferita e hai ampliato la tua base di conoscenza a diverse centinaia di documenti. Sembra proprio un'applicazione "vera".
Poi arriva il “Giorno 2”.
Man mano che gli utenti iniziano a porre domande più complesse, la "magia" iniziale comincia a sbiadire. Le crepe compaiono quando la tua applicazione RAG inventa con sicurezza una politica normativa inesistente o fallisce un'operazione di risoluzione dei problemi citando una brochure di marketing generica invece di uno schema tecnico specifico. La tensione sale quando entrano in gioco le parti interessate: il tuo CIO esige risposte sulla sicurezza e sulla privacy dei dati, mentre il reparto R&S segnala che il sistema rimane "cieco" rispetto ai diagrammi di flusso e agli schemi fondamentali sepolti nei loro file PDF.
Scopri presto che la precisione di recupero che ha tenuto duro per mille documenti si dissolve in "rumore semantico" a un volume dieci o cento volte superiore. Man mano che il sistema si espande, l'accuratezza ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access