Chapitre 5. Créer un système de recherche d'articles ArXiv avec PostgreSQL pgvector
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Ce chapitre va t'apprendre à créer un système de recherche d'articles ArXiv avec PostgreSQL pgvector, alors c'est parti.
Le défi de la recherche dans la littérature scientifique
Dans le paysage en constante évolution de la recherche scientifique, il est de plus en plus difficile de se tenir au courant des dernières avancées. À lui seul, ArXiv publie chaque mois des milliers de nouveaux articles dans les domaines de la physique, des mathématiques, de l’informatique et bien d’autres encore. La recherche traditionnelle par mots-clés ne parvient souvent pas à saisir les relations sémantiques entre les articles, passant ainsi à côté de travaux pertinents qui utilisent une terminologie différente ou abordent le même problème sous un angle différent.
Prenons l’exemple d’un chercheur qui étudie les « techniques d’optimisation des réseaux neuronaux ». Une recherche par mot-clé pourrait passer à côté d’articles traitant des « améliorations de la descente de gradient » ou de « l’efficacité de la rétropropagation », alors même que ces sujets sont directement pertinents. C’est dans ce fossé sémantique entre les requêtes de recherche et le contenu pertinent que les bases de données vectorielles excellent : elles comprennent le sens derrière le texte plutôt que de se contenter de ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access