book

Conception d'applications de modèles de langage de grande taille

Name: Conception d'applications de modèles de langage de grande taille
Author: Suhas Pai
ISBN: 9798341631809

by Suhas Pai

March 2025

Intermediate to advanced

366 pages

11h 5m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Préface
À qui s'adresse ce livreComment ce livre est structuréCe dont ce livre ne parle pasComment lire le livreConventions utilisées dans ce livreUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciements
I. Ingrédients du LLM
1. Introduction
Définir les LLMsUne brève histoire des LLMsLes premières annéesL'ère moderne du LLML'impact des LLMsL'utilisation du LLM dans l'entreprisePrompt à l'actionLes prompts à coup sûrPrompt à l'actionLe prompt à la chaîne de penséeChaînage promptPrompt à l'affrontementAccéder aux LLMs par le biais d'une APIAtouts et limites des LLMsConstruire ton premier prototype de chatbotDu prototype à la productionRésumé
2. Données de pré-entraînement
Les ingrédients d'un LLMExigences en matière de données de pré-entraînementEnsembles de données de pré-entraînement populairesDonnées synthétiques de pré-entraînementPrétraitement des données d'apprentissageFiltrage et nettoyage des donnéesSélection des documents de qualitéDéduplicationSuppression des informations personnellement identifiablesDécontamination de l'équipement de formationMélanges de donnéesEffet des données de pré-entraînement sur les tâches en avalProblèmes de biais et d'équité dans les ensembles de données de pré-entraînementRésumé
3. Vocabulaire et tokenisation
VocabulaireTokenizersPipeline de tokenisationNormalisationPrétokénisationTokenisationCodage des paires d'octetsPièce de motJetons spéciauxRésumé
4. Architectures et objectifs d'apprentissage
PréliminairesReprésenter le sensL'architecture du transformateurL'attention à soiEncodage positionnelRéseaux de type " Feedforward " (vers l'avant)Normalisation des couchesFonctions de perteÉvaluation du modèle intrinsèqueLes dorsales de transformateursArchitectures à encodeur seulArchitectures codeur-décodeurArchitectures à décodeur seulMélange d'expertsObjectifs d'apprentissageModélisation complète du langageModélisation du langage des préfixesModélisation du langage masquéQuels sont les meilleurs objectifs d'apprentissage ?Modèles de pré-entraînementRésumé
II. L'utilisation des LLMs
5. Adapter les LLMs à ton cas d'utilisation
Naviguer dans le paysage du LLMQui sont les fournisseurs de LLM ?Modèles de saveursLLMs Open SourceComment choisir un LLM pour ta tâche ?Les LLMs open source par rapport aux LLMs propriétairesÉvaluation du LLMChargement des LLMsAccélérer l'étreinte du visageOllamaAPI d'inférence LLMStratégies de décodageDécodage gourmandRecherche de poutreÉchantillonnage Top-kÉchantillonnage Top-pExécuter l'inférence sur les LLMsSorties structuréesDébogage et interprétabilité des modèlesRésumé
6. Mise au point
La nécessité d'une mise au pointMise au point : Un exemple completParamètres des algorithmes d'apprentissageParamètres d'optimisation de la mémoireParamètres de régularisationTaille du lotRéglage fin efficace des paramètresTravailler avec une précision réduiteAssembler le toutAjustement des ensembles de donnéesUtilisation d'ensembles de données de réglage d'instruction accessibles au publicEnsembles de données générés par LLM pour la mise au point des instructionsRésumé
7. Techniques avancées de réglage fin
Préformation continueReplay (Mémoire)Expansion des paramètresRéglage fin efficace des paramètresAjout de nouveaux paramètresMéthodes de sous-ensembleCombinaison de plusieurs modèlesAssemblage de modèlesModèle FusionFusion d'adaptateursRésumé

8. Formation à l'alignement et raisonnement
Définir la formation à l'alignementApprentissage par renforcementTypes de rétroaction humaineExemple de RLHFHallucinationsAtténuer les hallucinationsCohérence personnelleChaîne d'actionsRécitationMéthodes d'échantillonnage pour les hallucinationsDécodage par contraste des couchesHallucinations hors contexteHallucinations dues à des informations non pertinentesRaisonnementRaisonnement déductifRaisonnement inductifRaisonnement abductifRaisonnement de bon sensInduire le raisonnement dans les LLMsDes vérificateurs pour améliorer le raisonnementCalcul en temps réelUn réglage fin pour le raisonnementRésumé
9. Optimisation de l'inférence
Défis de l'inférence LLMTechniques d'optimisation de l'inférenceTechniques de réduction des calculsMise en cache K-VSortie anticipéeDistillation des connaissancesTechniques d'accélération du décodageDécodage spéculatifDécodage parallèleTechniques pour réduire les besoins de stockageQuantification symétriqueQuantification asymétriqueRésumé
III. Paradigmes d'application du LLM
10. Interfaçage des LLMs avec des outils externes
Paradigmes d'interaction LLMApproche passiveL'approche expliciteL'approche autonomeDéfinir les agentsFlux de travail agentiqueComposantes d'un système agentiqueModèlesOutilsMagasins de donnéesLe prompt de la boucle d'agentGarde-fous et vérificateursLogiciel d'orchestration des agentsRésumé
11. L'apprentissage de la représentation et les emboîtements
Introduction aux emboîtementsRecherche sémantiqueMesures de similaritéAffiner les modèles d'intégrationModèles de baseEnsemble de données de formationFonctions de perteIntégration de l'instructionOptimiser la taille de l'intégrationEmboîtements de MatryoshkaEmboîtements binaires et entiersQuantification des produitsChunking (découpage)Chunking des fenêtres coulissantesDécoupage en fonction des métadonnéesDécoupage en fonction de la mise en pageLe découpage sémantiqueChunking tardifBases de données vectoriellesInterprétation des emboîtementsRésumé
12. Génération assistée par récupération
La nécessité du RAGScénarios typiques de RAGDécider du moment de la récupérationLe pipeline RAGRéécritureRécupérerRerankRaffinerInsérerGénérerRAG pour la gestion de la mémoireRAG pour la sélection d'exemples de formation en contexteRAG pour la formation au modèleLimites du RAGRAG Versus Long ContextRAG ou réglage finRésumé
13. Modèles de conception et architecture du système
Architectures multi-LLMCascades LLMRouteursLLMs spécialisés dans les tâches à accomplirParadigmes de programmationDSPyLMQLRésumé
Index
A propos de l'auteur

Content preview from Conception d'applications de modèles de langage de grande taille

Chapitre 2. Données de pré-entraînement

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Au chapitre 1, nous avons présenté les modèles de langage, noté leurs forces et leurs limites, exploré les cas d'utilisation actuels et potentiels, et présenté les lois de mise à l'échelle qui semblent régir les progrès dans ce domaine. Pour préparer le terrain pour le reste de ce livre, nous allons, dans les trois chapitres suivants, discuter en détail de la recette du pré-entraînement des LLMs et des ingrédients qui entrent dans leur composition. Mais attends, ce livre traite de l'utilisation des LLMs pré-entraînés pour concevoir et réaliser des applications utilisateur. Pourquoi avons-nous besoin de discuter des nuances du pré-entraînement de ces modèles gargantuesques à partir de zéro, ce que la plupart des praticiens de l'apprentissage automatique ne feront jamais de leur vie ?

En fait, cette information est très importante parce que de nombreuses décisions prises pendant le processus de préformation ont un impact considérable sur les performances en aval. Comme nous le remarquerons dans les chapitres suivants, les modes d'échec sont plus facilement compréhensibles lorsque tu comprends le processus de formation. Tout comme nous apprécions que les ingrédients soient indiqués sur les emballages dans nos épiceries, nous aimerions connaître les ingrédients qui entrent dans la fabrication d'un modèle de langage ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341631809

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Conception d'applications de modèles de langage de grande taille

by Suhas Pai

Chapitre 2. Données de pré-entraînement

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.