Chapitre 7. Créer un système RAG scientifique avec PostgreSQL et pgvector
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
L'explosion du nombre de publications scientifiques pose un défi de taille aux chercheurs : comment découvrir, comprendre et synthétiser efficacement les connaissances pertinentes issues de millions d'articles ? À lui seul, ArXiv publie plus de 15 000 articles par mois dans les domaines de la physique, des mathématiques, de l'informatique et bien d'autres encore. La recherche traditionnelle par mots-clés ne parvient pas à saisir la richesse sémantique du discours scientifique, où un même concept peut être exprimé de multiples façons selon les domaines et les communautés de recherche .
Ce chapitre présente la construction d’un système RAG spécialement conçu pour la littérature scientifique. Contrairement aux systèmes RAG à usage général, un RAG scientifique doit relever des défis particuliers :
- Terminologie technique
Les articles utilisent un langage précis et spécifique à un domaine qui nécessite une compréhension sémantique allant au-delà de simples mots-clés.
- Contenu structuré
Les articles scientifiques suivent des conventions (résumé, méthodologie, résultats, conclusions) qui peuvent guider les stratégies de recherche.
- Réseaux de citations
Les articles s'inscrivent dans un réseau de références qui fournissent un contexte supplémentaire.
- Notation mathématique
Les formules ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access