book

Ingénierie IA

Name: Ingénierie IA
Author: Chip Huyen
ISBN: 9798341631441

by Chip Huyen

October 2025

Intermediate to advanced

534 pages

18h 17m

French

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Préface
L'objet de ce livreCe que ce livre n'est pasÀ qui s'adresse ce livreNaviguer dans ce livreConventions utilisées dans ce livreUtilisation d'exemples de codeFormation en ligne O'ReillyComment nous contacterRemerciements
1. Introduction à la création d'applications d'intelligence artificielle avec les modèles de fondation
L'essor de l'ingénierie de l'IADes modèles de langage aux grands modèles de langageDes grands modèles de langage aux modèles de baseDes modèles de base à l'ingénierie de l'IACas d'utilisation du modèle de baseCodageProduction d'images et de vidéosRédactionL'éducationBots conversationnelsAgrégation d'informationsOrganisation des donnéesAutomatisation du flux de travailPlanifier les applications d'IAÉvaluation des cas d'utilisationDéfinition des attentesPlanification des étapesMaintenanceLa pile d'ingénierie de l'IALes trois couches de la pile d'IAIngénierie de l'IA par rapport à l'ingénierie MLL'ingénierie de l'IA par rapport à l'ingénierie complèteSommaire
2. Comprendre les modèles de fondation
Données de formationModèles multilinguesModèles spécifiques à un domaineModélisationArchitecture du modèleTaille du modèlePost-formationAjustement superviséAjustement des préférencesL'échantillonnagePrincipes fondamentaux de l'échantillonnageStratégies d'échantillonnageTemps de test CalculSorties structuréesLa nature probabiliste de l'IARésumé
3. Méthodologie d'évaluation
Les défis de l'évaluation des modèles de fondationComprendre les mesures de modélisation du langageEntropieEntropie croiséeBits par caractère et bits par octetPerplexitéInterprétation de la perplexité et cas d'utilisationÉvaluation exacteCorrections fonctionnellesMesures de similarité par rapport à des données de référenceIntroduction à l'intégrationL'IA en tant que jugePourquoi l'IA en tant que juge ?Comment utiliser l'IA en tant que jugeLimites de l'IA en tant que jugeQuels modèles peuvent servir de juges ?Classement des modèles à l'aide d'une évaluation comparativeLes défis de l'évaluation comparativeL'avenir de l'évaluation comparativeRésumé
4. Évaluer les systèmes d'IA
Critères d'évaluationCapacité spécifique à un domaineCapacité de générationCapacité de suivi des instructionsCoût et latenceSélection de modèlesProcessus de sélection des modèlesConstruire ou acheter un modèleNaviguer dans les références publiquesConcevoir ton pipeline d'évaluationÉtape 1. Évaluer tous les composants d'un systèmeEtape 2. Créer un guide d'évaluation Étape 3. Définir les méthodes et les données d'évaluationRésumé
5. Ingénierie prompte
Introduction aux promptsApprentissage en contexte : Zero-Shot et Few-ShotLe prompt du système et le prompt de l'utilisateurLongueur du contexte et efficacité du contexteMeilleures pratiques en matière d'ingénierie des messages-guidesRédiger des instructions claires et explicitesFournir un contexte suffisantDiviser les tâches complexes en sous-tâches plus simplesDonne au modèle le temps de réfléchirRéexamine tes promptsÉvaluer les outils d'ingénierie des promptsOrganiser et réviser les promptsIngénierie défensive des messages-guidesLes prompts propriétaires et la rétro-ingénierie des promptsJailbreaking et injection d'invitesExtraction d'informationsDéfenses contre les attaques par messages-guidesRésumé
6. RAG et agents
RAGArchitecture du RAGAlgorithmes de récupérationOptimisation de la rechercheRAG au-delà des textesAgentsAperçu des agentsOutilsPlanificationModes de défaillance des agents et évaluationMémoireRésumé
7. Mise au point
Aperçu du réglage finQuand procéder à un réglage finRaisons de procéder à un réglage finRaisons de ne pas procéder à un réglage finLe réglage fin et le RAGGoulets d'étranglement de la mémoireRétropropagation et paramètres entraînablesMathématiques de la mémoireReprésentations numériquesQuantificationTechniques de réglage finRéglages efficaces en fonction des paramètresFusion de modèles et optimisation multi-tâchesTactiques de réglage finRésumé
8. Ingénierie des ensembles de données
Curation des donnéesQualité des donnéesCouverture des donnéesQuantité de donnéesAcquisition et annotation des donnéesAugmentation et synthèse des donnéesPourquoi la synthèse de données ?Techniques traditionnelles de synthèse de donnéesSynthèse de données alimentée par l'IADistillation de modèlesTraitement des donnéesInspecter les donnéesDédupliquer les donnéesNettoyer et filtrer les donnéesFormatage des donnéesRésumé
9. Optimisation de l'inférence
Comprendre l'optimisation de l'inférenceAperçu de l'inférenceMesures de performance de l'inférenceAccélérateurs d'IAOptimisation de l'inférence Optimisation des modèlesOptimisation du service d'inférenceRésumé

10. Architecture de l'ingénierie de l'IA et commentaires des utilisateurs
Architecture de l'ingénierie de l'IAÉtape 1. Améliorer le contexteÉtape 2. Mettre en place des garde-fousÉtape 3. Ajouter un modèle de routeur et de passerelleÉtape 4. Réduire la latence avec les cachesÉtape 5. Ajouter des modèles d'agentsSurveillance et observabilitéOrchestration du pipeline d'IARétroaction de l'utilisateurExtraction du feedback conversationnelConception de la rétroactionLimites de la rétroactionRésumé
Épilogue
Index
A propos de l'auteur

Content preview from Ingénierie IA

Chapitre 4. Évaluer les systèmes d'IA

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Un modèle n'est utile que s'il fonctionne aux fins prévues. Tu dois évaluer les modèles dans le contexte de ton application. Le chapitre 3 présente différentes approches de l'évaluation automatique. Ce chapitre explique comment utiliser ces approches pour évaluer les modèles pour tes applications.

Ce chapitre comporte trois parties. Il commence par une discussion sur les critères que tu pourrais utiliser pour évaluer tes applications et sur la façon dont ces critères sont définis et calculés. Par exemple, de nombreuses personnes s'inquiètent que l'IA invente des faits - comment la cohérence des faits est-elle détectée ? Comment sont mesurées les capacités spécifiques à un domaine comme les mathématiques, les sciences, le raisonnement et la synthèse ?

La deuxième partie se concentre sur la sélection des modèles. Étant donné le nombre croissant de modèles de base parmi lesquels choisir, il peut être difficile de choisir le bon modèle pour ton application. Des milliers de points de référence ont été introduits pour évaluer ces modèles selon différents critères. Peut-on se fier à ces critères ? Comment choisir les critères à utiliser ? Qu'en est-il des classements publics qui regroupent plusieurs critères ?

Le paysage des modèles regorge de modèles propriétaires et de modèles open source. Une question que de nombreuses ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341631441

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Ingénierie IA

by Chip Huyen

Chapitre 4. Évaluer les systèmes d'IA

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.