book

Systèmes de production à apprentissage automatique

Name: Systèmes de production à apprentissage automatique
ISBN: 9798341631076

by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu

March 2025

Intermediate to advanced

474 pages

15h 29m

French

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Avant-propos
Préface
Qui devrait lire ce livre ?Pourquoi nous avons écrit ce livreNaviguer dans ce livreConventions utilisées dans ce livreUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciementsRobertHannesEmilyDi
1. Introduction aux systèmes de production par apprentissage automatique
Qu'est-ce que l'apprentissage automatique de la production ?Avantages des pipelines d'apprentissage automatiqueConcentre-toi sur le développement de nouveaux modèles, et non sur le maintien des modèles existantsPrévention des insectesCréation de fiches pour le débogage et la reproduction des résultats.La normalisationL'analyse de rentabilité des pipelines de ML Quand utiliser les pipelines d'apprentissage automatiqueÉtapes d'un pipeline d'apprentissage automatiqueIngestion et versionnement des donnéesValidation des donnéesIngénierie de pointeEntraînement et mise au point du modèleAnalyse du modèleDéploiement du modèleRegarder vers l'avenir
2. Collecte, étiquetage et validation des données
Considérations importantes pour la collecte des donnéesCollecte responsable des donnéesÉtiquetage des données : Changements de données et dérive dans la production MLDonnées d'étiquetage : Étiquetage direct et étiquetage humainValider les données : Détecter les problèmes de donnéesValidation des données : Validation des données TensorFlowDétection du skew avec TFDVTypes d'obliquitéExemple : Repérer les ensembles de données déséquilibrés avec la validation des données TensorFlow.Conclusion
3. Ingénierie et sélection des caractéristiques
Introduction à l'ingénierie des fonctionnalitésOpérations de prétraitementTechniques d'ingénierie des fonctionnalitésNormalisation et standardisationBucketizingCroix de fonctionDimensionnalité et emboîtementsVisualisationTransformation des caractéristiques à l'échelleChoisis un cadre qui s'adapte bienÉviter le déséquilibre entre la formation et le serviceConsidérer les transformations au niveau de l'instance plutôt que les transformations complètesUtilisation de la transformation TensorFlowAnalyseursExemple de codeSélection des caractéristiquesEspaces d'expositionAperçu de la sélection des caractéristiquesMéthodes de filtrageMéthodes d'habillageMéthodes intégréesSélection de caractéristiques et d'exemples pour les LLMs et GenAIExemple : Utilisation de la transformation TF pour tokeniser le texteAvantages de l'utilisation de TF Transform Alternatives à TF TransformConclusion
4. Parcours et stockage des données
Voyage de donnéesMétadonnées MLUtilisation d'un schémaDéveloppement de schémasEnvironnements de schémaChangements entre les ensembles de données Stockage de données d'entrepriseMagasins d'articles vedettesEntrepôts de donnéesLacs de donnéesConclusion
5. Étiquetage avancé, augmentation et prétraitement des données
Étiquetage avancéÉtiquetage semi-superviséApprentissage actifFaible supervisionExamen avancé de l'étiquetageAugmentation des donnéesExemple : CIFAR-10Autres techniques d'augmentationExamen de l'augmentation des donnéesPrétraitement des données de séries temporelles : Un exempleWindowsÉchantillonnageConclusion
6. Modéliser les techniques de gestion des ressources
Réduction de la dimensionnalité : Effet de la dimensionnalité sur la performanceExemple : Intégration de mots à l'aide de KerasLa malédiction de la dimensionnalitéL'ajout de dimensions augmente le volume de l'espace de représentationRéduction de la dimensionnalitéQuantification et élagageMobile, IoT, Edge et cas d'utilisation similaires.QuantificationOptimiser ton modèle TensorFlow avec TF LiteOptions d'optimisationÉlagageDistillation des connaissancesRéseaux d'enseignants et d'élèvesTechniques de distillation des connaissancesTMKD : Distiller des connaissances pour une tâche de questions-réponsesAugmenter la robustesse en distillant les réseaux efficacesConclusion
7. Modélisation haute performance
Formation distribuéeParallélisme des donnéesPipelines d'entrée efficacesPrincipes de base du pipeline d'entréeModèles de pipeline d'entrée : Améliorer l'efficacitéOptimise ton pipeline d'entrée avec les données de TensorFlow.Formation de grands modèles : La montée des réseaux neuronaux géants et du parallélismeLes solutions possibles et leurs lacunesLe parallélisme des pipelines à la rescousse ?Conclusion
8. Analyse du modèle
Analyser les performances du modèleÉvaluation de la boîte noireMesures de performance et objectifs d'optimisationAnalyse avancée des modèlesAnalyse du modèle TensorFlowL'outil d'interprétabilité de l'apprentissageDébogage avancé du modèleModèles de référenceAnalyse de sensibilitéAnalyse des résidusRemédiation du modèleRemédiation à la discriminationL'équitéÉvaluation de l'équitéConsidérations sur l'équitéÉvaluation et suivi continusConclusion

9. Interprétabilité
L'IA explicableMéthodes d'interprétation des modèlesCatégories de méthodesModèles intrinsèquement interprétablesMéthodes d'analyse des modèlesExplications locales interprétables du modèle-gnostique Valeurs de ShapleyLa bibliothèque du SHAP Test des vecteurs d'activation des concepts Explications sur l'IAExemple : Explorer la sensibilité du modèle avec SHAPModèles de régressionModèles de traitement du langage naturelConclusion
10. Recherche d'architecture neuronale
Réglage des hyperparamètresIntroduction à AutoMLComposants clés des NASEspaces de rechercheStratégies de rechercheStratégies d'estimation des performancesAutoML dans le CloudAmazon SageMaker AutopilotApprentissage automatique de Microsoft AzureGoogle Cloud AutoMLUtilisation d'AutoMLIA générative et AutoMLConclusion
11. Introduction au service de modèles
Modèle de formationModèle de prédictionTemps de latenceDébitCoûtRessources et exigences pour les modèles de serviceCoût et complexitéAccélérateursNourrir la bêteDéploiements de modèlesDéploiement de centres de donnéesDéploiements mobiles et distribuésServeurs modèlesServices gérésConclusion
12. Modèles de service
Inférence par lotsDébit par lotCas d'utilisation de l'inférence par lotsETL pour les systèmes distribués de traitement par lots et par fluxIntroduction à l'inférence en temps réelLivraison synchrone de prédictions en temps réelLivraison asynchrone de prédictions en temps réelOptimiser l'inférence en temps réelCas d'utilisation de l'inférence en temps réelServir des ensembles modèlesTopologies d'ensembleExemple d'ensembleConsidérations sur le service d'ensembleRouteurs modèles : Ensembles dans GenAIPrétraitement et post-traitement des données en temps réelTransformations de formation et transformations de serviceWindowsOptions de prétraitementEntrer dans la transformation TensorFlowPost-traitementInférence au bord et au niveau du navigateurLes défisModéliser les déploiements via les conteneursFormation sur l'appareilApprentissage fédéréInteropérabilité en cours d'exécutionInférence dans les navigateurs WebConclusion
13. Modèle d'infrastructure de desserte
Serveurs modèlesServir TensorFlowServeur d'inférence NVIDIA TritonTorchServeConstruire une infrastructure évolutiveConteneurisationL'ère du déploiement traditionnelL'ère du déploiement virtualiséL'ère du déploiement des conteneursLe cadre de conteneurisation DockerOrchestration de conteneursFiabilité et disponibilité grâce à la redondanceObservabilitéHaute disponibilitéDéploiements automatisésAccélérateurs matérielsGPUTPUsConclusion
14. Modèles de service
Exemple : Déploiement de modèles TensorFlow avec TensorFlow Serving.Exporter des modèles Keras pour le service TFConfiguration de TF Serving avec DockerConfiguration de base de TF ServingFaire des demandes de prédiction de modèle avec RESTFaire des demandes de prédiction de modèle avec gRPCObtenir des prédictions à partir de modèles de classification et de régressionUtilisation des charges utilesObtenir des métadonnées de modèle à partir de TF ServingFaire des demandes d'inférence par lotExemple : Profilage de TF Serving Inferences avec TF ProfilerConditions préalablesConfiguration de TensorBoardProfil du modèleExemple : Configuration de base de TorchServeInstallation des dépendances de TorchServeExporter ton modèle pour TorchServeConfiguration de TorchServeFaire des demandes de prédiction de modèleFaire des demandes d'inférence par lotConclusion
15. Gestion et livraison des modèles
Suivi des expériencesExpérimenter dans les carnetsExpérimenter dans l'ensembleOutils pour le suivi des expériences et des versionsIntroduction aux MLOpsLes scientifiques des données par rapport aux ingénieurs en logicielIngénieurs MLML dans Produits et servicesMLOpsMéthodologie de MLOpsMLOps Niveau 0MLOps niveau 1MLOps niveau 2Composants d'un flux de travail orchestréTrois types de composants personnalisésComposants Python basés sur des fonctionsComposants basés sur des conteneursComposants entièrement personnalisésPlongée profonde dans le TFXTFX SDKReprésentation intermédiaireTemps d'exécutionMise en œuvre d'un pipeline de ML à l'aide des composants TFXFonctionnalités avancées de TFXGérer les versions du modèleApproches des modèles de versionLignée de modèlesRegistres modèlesIntégration et déploiement continusIntégration continueLivraison continueLivraison progressiveDéploiement bleu/vertDéploiement du canariExpérimentation en directConclusion
16. Surveillance et enregistrement des modèles
L'importance de la surveillanceL'observabilité dans l'apprentissage automatiqueQue dois-tu surveiller ?Alertes personnalisées dans TFXEnregistrementTraçage distribuéSurveillance de la désintégration du modèleDérive des données et dérive des conceptsDétection de la décroissance du modèleTechniques de surveillance superviséeTechniques de surveillance non superviséeAtténuer la dégradation du modèleReconditionne ton modèleQuand se recycler ?Recyclage automatiséConclusion
17. Confidentialité et exigences légales
Pourquoi la confidentialité des données est-elle importante ?Quelles sont les données qui doivent rester confidentielles ?HarmsNe collecte que ce dont tu as besoinDonnées GenAI extraites du Web et d'autres sourcesExigences légalesLe GDPR et le CCPALe droit à l'oubli du GDPR Pseudonymisation et anonymisationConfidentialité différentiellePDD local et mondialEpsilon-Delta DPApplication de la confidentialité différentielle à la MLExemple de confidentialité de TensorFlowApprentissage fédéréML cryptéConclusion
18. Orchestrer les pipelines d'apprentissage automatique
Introduction à l'orchestration des pipelinesPourquoi l'orchestration des pipelines ?Graphes acycliques dirigésOrchestration du pipeline avec TFXPipelines TFX interactifsConvertir ton pipeline interactif pour la production Orchestrer les pipelines TFX avec Apache BeamOrchestrer les pipelines TFX avec les pipelines KubeflowIntroduction aux pipelines KubeflowInstallation et configuration initialeAccéder aux pipelines de KubeflowLe flux de travail de TFX à KubeflowFonctions OpFuncOrchestrer les pipelines de KubeflowPipelines de Google Cloud VertexConfiguration de Google Cloud et des pipelines VertexConfiguration d'un compte Google Cloud ServiceOrchestrer les pipelines avec Vertex PipelinesExécution des pipelines de sommetChoisir ton orchestrateurTFX interactifApache BeamPipelines KubeflowPipelines de Google Cloud VertexAlternatives à TFXConclusion
19. TFX avancé
Pratiques avancées en matière de pipelinesConfigure tes composantsImporter des artefactsUtiliser le nœud de résolution Exécuter un pipeline conditionnel Modèles Export TF LiteFormation au modèle de démarrage à chaudUtilise des gestionnaires de sortieMessages de déclenchement de TFXComposants TFX personnalisés : Architecture et cas d'utilisationArchitecture des composants TFXCas d'utilisation des composants personnalisésUtilisation de composants personnalisés basés sur des fonctionsÉcrire un composant personnalisé à partir de zéroDéfinir les spécifications des composantsDéfinir les canaux de composantsÉcriture de l'exécuteur personnaliséÉcriture du pilote personnaliséAssemblage du composant personnaliséUtilisation de notre composant personnalisé de baseExamen de la mise en œuvreRéutiliser les composants existantsCréation de composants personnalisés basés sur des conteneursQuel est le composant personnalisé qui te convient le mieux ?TFX-AddonsConclusion
20. Pipelines de ML pour les problèmes de vision par ordinateur
Nos donnéesNotre modèleComposant d'ingestion personnaliséPrétraitement des donnéesExporter le modèle Notre pipelineIngestion de donnéesPrétraitement des donnéesModèle de formationÉvaluation du modèle Modèle ExportAssembler le tout Exécution sur Apache BeamExécution sur les pipelines de sommet Déploiement de modèles avec TensorFlow ServingConclusion
21. Pipelines ML pour le traitement du langage naturel
Nos donnéesNotre modèleComposant de l'ingestionPrétraitement des donnéesLa mise en place du pipelineExécuter le pipeline Déploiement de modèles avec Google Cloud VertexEnregistrer ton modèle MLCréer un nouveau point de terminaison de modèleDéployer ton modèle de MLDemander des prédictions au modèle déployéNettoyer ton modèle déployéConclusion
22. IA générative
Modèles génératifsTypes de modèles GenAIAgents et copilotesPréformationJeux de données de pré-entraînementEmboîtementsFormation auto-supervisée avec des masquesMise au pointApprentissage de précision ou apprentissage par transfertAjustement des ensembles de donnéesConsidérations sur la mise au point pour la productionAjustement par rapport aux modèles d'APIRéglage fin efficace des paramètresLoRAS-LoRAAlignement humainApprentissage par renforcement à partir de commentaires humainsApprentissage par renforcement à partir des commentaires de l'IAOptimisation directe des préférencesPrompt à l'actionChaînageRécupération Génération augmentéeReactL'évaluationTechniques d'évaluationAnalyse comparative des modèlesLMOpsLes attaques de la GenAIJailbreaksInjection prompteResponsable GenAILa conception pour la responsabilitéEffectuer des tests contradictoiresIA constitutionnelleConclusion
23. L'avenir des systèmes de production à apprentissage automatique et les prochaines étapes.
Pensons en termes de systèmes de ML, pas de modèles de MLRapprocher les systèmes de ML des experts du domaineLa vie privée n'a jamais été aussi importanteConclusion
Index
À propos des auteurs

Content preview from Systèmes de production à apprentissage automatique

Chapitre 12. Modèles de service

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Une fois qu'ils ont été formés, les modèles ML sont utilisés pour générer des prédictions, ou des résultats, un processus que l'on appelle l'exécution de l'inférence ou le service du modèle. La valeur ultime du modèle réside dans les résultats qu'il génère, qui doivent refléter le plus fidèlement possible les informations contenues dans les données d'entraînement, sans pour autant les reproduire. En d'autres termes, le modèle de ML doit bien se généraliser et être aussi précis, fiable et stable que possible. Dans ce chapitre, nous examinerons quelques-uns des nombreux modèles qui servent à servir les modèles, ainsi que l'infrastructure requise.

Les principales façons de servir un modèle sont soit un processus par lots, soit un processus en temps réel. Nous parlerons des deux, ainsi que du pré et post-traitement des données, et d'applications plus spécialisées telles que le service à la périphérie ou dans un navigateur.

Inférence par lots

Après avoir entraîné, évalué et réglé un modèle ML, le modèle est déployé en production pour générer des prédictions. Dans les applications où un délai est acceptable, un modèle peut être utilisé pour fournir des prédictions par lots, qui seront ensuite appliquées à un cas d'utilisation un peu plus tard.

On parle de prédiction basée sur l'inférence par lots lorsque ton modèle est utilisé ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Nerds on Wall Street: Math, Machines, and Wired Markets

Publisher Resources

ISBN: 9798341631076

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Systèmes de production à apprentissage automatique

by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu

Chapitre 12. Modèles de service

Inférence par lots

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.