book

Bases de données vectorielles (French Edition)

Name: Bases de données vectorielles (French Edition)
Author: Nitin Borwankar
ISBN: 0642572369804

by Nitin Borwankar

April 2026

Intermediate

292 pages

7h 12m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Préface
Contenu de ce livreÀ qui s'adresse ce livreComment utiliser ce livreConfiguration logicielle, environnement et ressources requisesConventions utilisées dans ce livreUtilisation des exemples de codeO’Reilly Online LearningComment nous contacterRemerciements
1. Introduction aux bases de données vectorielles
Pourquoi as-tu besoin de bases de données vectorielles ?Un nouveau type de données : le vecteurRecherche de similaritéEn quoi le type vectoriel est-il différent ?Où utilise-t-on les bases de données vectorielles ?SQL contre bases de données vectoriellesLes bases des maths en entreprise : l'arithmétique comptableReprésentation vectorielle dans un système de gestion de bases de données relationnellesLe besoin de fonctionnalités spécifiques aux vecteursNoSQL contre bases de données vectoriellesBases de données NoSQL et stockage vectorielLimites des extensions vectorielles dans les bases de données NoSQLQuand choisir NoSQL avec des extensions vectoriellesApproches hybrides : combiner données structurées et vectoriellesLa nécessité de disposer à la fois de données vectorielles et de métadonnéesLimites du stockage vectoriel purArchitecture de base de données hybrideExemple de requête hybrideAvantages de l'approche hybrideConclusion
2. Représentations
Comprendre les représentations vectorielles : pourquoi on en a besoinWord2Vec : la percée qui a tout changéDoc2Vec : des mots aux documentsDes représentations aux modèles linguistiques modernes : le lien avec TransformerTransformateurs à encodeur uniquement (BERT et ses variantes)Transformateurs à décodeur uniquement (famille GPT)Transformateurs encodeur-décodeur (T5, BART)Modèles d'embedding : les générateurs de vecteurs spécialisésDifférence par rapport aux modèles traditionnelsRôle dans les applications LLM modernesApplications pratiques et cas d'utilisationPipeline RAG simpleLa bibliothèque Sentence-Transformers : le couteau suisse des embeddings de texteBonnes pratiques pour l'utilisation de SentenceTransformers : un guide détailléLa couche d'encodage : la porte d'entrée vers l'apprentissage sans échantillonAnatomie des représentations de TransformerLien avec l'apprentissage sans échantillonCaractéristiques clés permettant l'apprentissage sans échantillonLimites et considérationsDernières évolutions et tendancesL'arithmétique vectorielle avec Word2Vec : un guide pratiqueÉtape 1 : Configuration et installationÉtape 2 : Chargement du modèle Word2Vec pré-entraînéÉtape 3 : Implémenter les fonctions arithmétiques vectoriellesÉtape 4 : Analogie classique roi-reineÉtape 5 : Autres analogies intéressantesÉtape 6 : Outil d'exploration interactifConclusion sur l'arithmétique vectorielleConclusion
3. Recherche par similarité avec FAISS
Les basesReprésentations vectoriellesMesures de distanceHeuristiques de sélectionIndex FAISSIndex plats (force brute)Index basés sur l'IVFIndex basés sur LSHIndex basés sur HNSWAutres index spécialisésIndex composites et transformatifsChoisir le bon indiceQuantificationSQPQLe problème des réseaux neuronaux artificielsLe problèmeÉviter les coûts de calculPrincipales techniques ANN dans FAISSChoisir un index dans FAISSExemple de codeComprendre les index HNSWQu'est-ce que HNSW ?Comment fonctionne HNSWExplication des paramètres clésExemple pratique : créer un système de recherche par similaritéCaractéristiques de performanceBonnes pratiquesArchitecture et composants de FAISSPrincipes de baseConcepts fondamentauxComposants clésFlux de travail courantExemple illustratifPoints clés à retenirApprofondissementConclusion
4. Recherche sémantique avec SQLite3
Comprendre l'extension de recherche par similarité vectorielle de SQLiteFonctionnalités principalesAperçu de l'architectureLimitesConfigurer l'environnement de développementInstallation des dépendancesVérification de l'installationConseils pratiquesConcevoir le schéma de la base de donnéesExigences relatives au schémaDéfinitions des tablesDécisions de conception du schémaSe connecter à Reddit avec le wrapper API Python de RedditCréation des identifiants de l'API RedditImplémentation du client PRAWExemple d'utilisationExtraction et prétraitement du contenuPipeline de nettoyage de texteFiltrage de qualitéGénération et stockage des représentations vectoriellesGénérateur d'intégrationStockage en base de donnéesPipeline de traitement par lotsCréation de l'index vectorielComprendre l'indexation VSSGestion des indexMise en œuvre de la recherche sémantiqueConteneur de résultats de rechercheMoteur de rechercheTout mettre en placeExemple de workflowExemple de résultatExtension : l'indexation incrémentielleConclusion
5. Créer un système de recherche d'articles ArXiv avec PostgreSQL pgvector
Le défi de la recherche dans la littérature scientifiquePourquoi ArXiv est une source de données idéaleCas d'utilisation concretsJustification de la pile technologiquePrésentation de l'architectureComposants du systèmeFlux de donnéesPhilosophie de conceptionConfiguration de l'environnement et dépendancesInstallation de PostgreSQL et pgvectorConfiguration de l'environnement PythonStructure et configuration des répertoiresVérification et testsConception de la base de données pour les articles scientifiquesPrincipes de conception du schémaStructure des tables principalesStratégie de stockage vectorielStratégie d'indexationIntégration d'ArXiv et gestion des PDFImplémentation du client API ArXivPipeline de téléchargement de PDFSystème de traitement par lotsExtraction et traitement du texte des PDFDéfis liés à l'extraction de PDFSegmentation intelligente du texteGénération et stockage des intégrationsStratégie de modèle d'intégrationPipeline de traitement par lotsImplémentation de la recherche par similaritéApplication interactive et interface utilisateurPackage Docker pour un déploiement localArchitecture conteneuriséeConfiguration de Docker ComposeScripts d'initialisation de la base de donnéesWorkflow de développementConception prête pour le cloudOptimisation de base des performancesConfiguration des indexPerformances des requêtesGestion des ressourcesProchaines étapesLimites actuellesIdées d'améliorationCe qu'on a faitRéalisations du systèmeCompétences techniques acquisesOutil de recherche pratiqueBases pour des systèmes avancésPotentiel futurConclusion
6. Créer un système de génération augmentée par la recherche avec SQLite VSS et Ollama
Aperçu de l'architecture du systèmeBase de données avec prise en charge vectorielleConfiguration de la base de données vectorielleConception du schéma pour RAGCréation d'index de rechercheTraitement de texte et génération d'embeddingsIntégration de la gestion des modèlesSegmentation intelligente du texteStockage de contenu avec des représentationsMise en œuvre de la recherche hybrideAlgorithme de recherche hybrideComposant de recherche sémantiqueComposant de recherche par mots-clésFusion des scores et classementIntégration du LLM avec OllamaClient API OllamaFonction de vérification de l'état de santéLe pipeline RAGMise en forme du contextePipeline de questions-réponsesDémonstration et testsChargement d'exemples de donnéesFonction de démonstration principaleInterface interactive de questions-réponsesUtilitaire de test rapideProchaines étapes : étendre le systèmeDonnées Reddit manquantesOptimisations des performancesConsidérations relatives à la productionModèles RAG avancésConclusion
7. Créer un système RAG scientifique avec PostgreSQL et pgvector
Objectifs et capacités du systèmePrésentation de l'architectureBase de données avec pgvectorConfiguration et installation de la base de donnéesConception de schémas pour les articles scientifiquesIndex vectoriels haute performanceStratégie de génération d'intégrationIntégration d'ArXiv et traitement des PDFRecherche d'articles avec l'API ArXivExtraction intelligente de texte à partir de PDFSegmentation avancée du textePipeline de stockage avec encodagesRecherche sémantique à plusieurs niveauxRecherche au niveau des résumésRecherche au niveau des sectionsLe pipeline RAG : analyse approfondieIntégration locale de LLM avec OllamaVérification de l'état de santé et découverte de modèlesRécupération intelligente du contexteIngénierie scientifique des promptsPipeline d'exécution RAG completDémonstration et interface interactiveFlux de démonstration principalDémonstrations de rechercheDémonstration RAGInterface de recherche interactivePoint d'entrée avec sélection du modeNote technique sur le HNSWComment évaluer tes résultatsProchaines étapes : étendre le système RAG scientifiqueConclusion
8. Créer un système complet de recherche conversationnelle et RAG
Objectifs et capacités du systèmeAperçu de l'architecture du systèmeCe qu’on va construire ensembleBase de données pour le stockage des conversationsConception du schéma de conversationArchitecture à trois tables pour des performances optimalesIndexation vectorielle haute performanceImportation des conversations et pipeline de traitement des donnéesImportation JSON robuste avec gestion des erreursTraitement des transactions atomiquesGestion des horodatages et validation des donnéesRécupération après erreur et journalisationGénération efficace d'embeddings et traitement par lotsModèle Singleton pour la gestion des modèlesStratégie de traitement incrémentalTraitement par lots pour des performances optimalesInsertion dans la base de données avec gestion des conflitsRecherche contextuelle avec compréhension conversationnelleRecherche par similarité sémantiqueJointures multi-tables pour un contexte richeMise en forme et structure des résultatsRécupération du contexte de conversationCalcul de la fenêtre contextuelleIntégration RAG pour l'historique des conversationsGestion structurée du contexteIntégration de LLM local avec OllamaSurveillance de l'état de santé et découverte de modèlesRécupération et assemblage du contexteIngénierie des prompts conversationnelsPipeline RAG complet avec surveillance des performancesAPI Web complète avec FastAPIStructure de l'application FastAPIModèles de requête avec validationImplémentation du point de terminaison de recherchePoint de terminaison de questions-réponses RAGStatistiques et surveillance du systèmeDémarrage et configuration du serveurDémonstration et exemples de donnéesGénération de données d'échantillons réalistesCouverture d'échantillons multithématiquesPipeline de traitement des données d'échantillonsDémonstration complète du systèmeDémonstration progressive des fonctionnalitésDémonstration RAG avec exécution conditionnelleFonctionnalité d'importation en productionPoints d'entrée de l'applicationConclusion : un système de connaissances personnel complet
9. Langage de requête vectorielle
Concepts fondamentauxModèle de donnéesStructure syntaxique de baseOpérations vectoriellesRecherche par similaritéRecherche hybrideRecherche par plageOpérations par lotsFonctions vectorielles et agrégationsFonctions vectoriellesAgrégations de vecteurs

Index
À propos de l'auteur

Content preview from Bases de données vectorielles (French Edition)

Chapitre 6. Créer un système de génération augmentée par la recherche avec SQLite VSS et Ollama

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Dans les chapitres précédents, on s’est concentré sur les différents composants de la recherche vectorielle : la création d’embeddings et l’exécution de requêtes de similarité. Il est maintenant temps d’assembler ces éléments pour former un système fonctionnel de génération augmentée par la recherche (RAG).

Contrairement aux applications web à grande échelle qui s’appuient sur des clusters Cloud distribués, notre objectif ici est de construire un système RAG hautement performant, privé et entièrement local, fonctionnant sur un seul ordinateur de bureau. On utilisera SQLite VSS pour notre moteur de recherche et Ollama comme « cerveau » LLM local.

Les systèmes RAG résolvent une limite fondamentale des LLMs : leurs connaissances sont figées au moment de l'entraînement, ce qui empêche l'accès à des informations privées ou récentes. En enrichissant les LLMs d'un mécanisme de récupération, on crée un système qui répond aux questions en utilisant des connaissances à jour et spécifiques à un domaine.

Notre objectif est de construire un système de questions-réponses qui réponde intelligemment aux requêtes concernant le contenu de Reddit. Lorsqu’un utilisateur pose une question, le système va (1) rechercher dans les publications Reddit stockées pour trouver les informations ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

What Successful Brick-and-Mortar Retailers Get Right

Publisher Resources

ISBN: 0642572369804

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Bases de données vectorielles (French Edition)

by Nitin Borwankar

Chapitre 6. Créer un système de génération augmentée par la recherche avec SQLite VSS et Ollama

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.