book

L'apprentissage automatique pour les applications à haut risque

Name: L'apprentissage automatique pour les applications à haut risque
ISBN: 9798341610576

by Patrick Hall, James Curtis, Parul Pandey

November 2024

Intermediate to advanced

470 pages

17h 58m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Avant-propos
Préface
Qui devrait lire ce livre ?Ce que les lecteurs apprendrontAlignement sur le cadre de gestion des risques liés à l'IA du NISTPlan du livrePartie IPartie IIPartie IIIExemples d'ensembles de donnéesDonnées sur le crédit à TaiwanKaggle Données sur la radiographie du thoraxConventions utilisées dans ce livreChiffres en ligneUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciementsPatrick HallJames CurtisParul Pandey
I. Théories et applications pratiques de la gestion des risques liés à l'IA
1. Gestion contemporaine des risques par apprentissage automatique
Un aperçu du paysage juridique et réglementaireLa proposition de loi européenne sur l'IALois et réglementations fédérales américainesLois de l'État et des municipalitésResponsabilité de base du fait des produitsApplication de la loi par la Commission fédérale du commercePratiques exemplaires faisant autoritéIncidents liés à l'IACompétences culturelles pour la gestion des risques liés à l'apprentissage automatiqueResponsabilité organisationnelleUne culture du défi efficaceDes équipes diversifiées et expérimentéesBoire notre propre champagneAller vite et tout casserProcessus organisationnels pour la gestion des risques liés à l'apprentissage automatiquePrévision des modes de défaillanceProcessus de gestion des risques liés aux modèlesAu-delà de la gestion du risque de modèleÉtude de cas : L'ascension et le déclin de iBuying de ZillowFalloutLeçons apprisesRessources
2. Apprentissage automatique interprétable et explicable
Idées importantes pour l'interprétabilité et l'explicabilitéModèles explicablesModèles additifsArbres de décisionUn écosystème de modèles d'apprentissage automatique explicablesExplication post hocAttribution et importance des caractéristiquesModèles de substitutionGraphiques de la performance du modèleProfilage des grappesDifficultés persistantes de l'explication post hoc dans la pratiqueJumelage des modèles explicables et de l'explication post hocÉtude de cas : Classés par algorithmeRessources
3. Débogage des systèmes d'apprentissage automatique pour la sécurité et la performance
FormationReproductibilitéQualité des donnéesSpécification du modèle pour les résultats dans le monde réelDébogage du modèleTests de logicielsModèle traditionnel d'évaluationBugs courants de l'apprentissage automatiqueAnalyse des résidusAnalyse de sensibilitéModèles de référenceRemédiation : Réparer les boguesDéploiementSécurité du domaineSurveillance du modèleÉtude de cas : Mort par véhicule autonomeFalloutUn système juridique non préparéLeçons apprisesRessources
4. Gérer les biais dans l'apprentissage automatique
Définitions ISO et NIST des biaisBiais systémiqueBiais statistiqueBiais humains et culture de la science des donnéesNotions juridiques des préjugés ML aux États-UnisQui a tendance à être victime de biais de la part des systèmes de ML ?Les préjudices que les gens subissentTest de partialitéDonnées de testApproches traditionnelles : Tester des résultats équivalentsUn nouvel état d'esprit : Test pour une qualité de performance équivalenteA l'horizon : Tests pour l'écosystème ML élargiPlan de test sommaireAtténuer les préjugésFacteurs techniques pour atténuer les préjugésLa méthode scientifique et la conception expérimentaleMéthodes d'atténuation des biaisLes facteurs humains dans l'atténuation des préjugésÉtude de cas : Le Bug Bounty de BiasRessources
5. Sécurité pour l'apprentissage automatique
Les bases de la sécuritéL'état d'esprit antagonisteTriade de la CIAMeilleures pratiques pour les scientifiques des donnéesAttaques par apprentissage automatiqueAttaques d'intégrité : Manipulation des résultats de l'apprentissage automatiqueAttaques de confidentialité : Informations extraitesPréoccupations générales en matière de sécurité MLContre-mesuresDébogage de modèles pour la sécuritéSurveillance des modèles pour la sécuritéTechnologies d'amélioration de la confidentialitéApprentissage automatique robusteContre-mesures généralesÉtude de cas : Attaques d'évasion dans le monde réelAttaques d'évasionLeçons apprisesRessources
II. Mise en œuvre de la gestion des risques liés à l'IA
6. Machines de stimulation explicables et explication de XGBoost
Rafraîchissement des concepts : Transparence de l'apprentissage automatiqueAdditivité ou interactionÉtapes vers la causalité avec des contraintesDépendance partielle et espérance conditionnelle individuelleValeurs de ShapleyDocumentation du modèleLa famille des modèles explicables GAMElastic Net-Penalized GLM with Alpha and Lambda Search (GLM pénalisé par le réseau élastique avec recherche alpha et lambda)Modèles additifs généralisésGA2M et machines de stimulation explicablesXGBoost avec contraintes et explication post hocXGBoost avec et sans contraintesExpliquer le comportement d'un modèle avec la dépendance partielle et l'ICELes modèles de substitution de l'arbre de décision comme technique d'explicationExplications de la valeur de ShapleyProblèmes avec les valeurs de ShapleyUne sélection de modèles mieux informéeRessources

7. Explication d'un classificateur d'images PyTorch
Explication de la classification des radiographies du thorax.Rafraîchissement des concepts : Modèles explicables et techniques d'explication post hocAperçu des modèles explicablesMéthodes d'occlusionMéthodes basées sur le gradientL'IA explicable pour le débogage de modèlesModèles explicablesProtoPNet et ses variantesAutres modèles explicables de Deep LearningFormer et expliquer un classificateur d'images PyTorchDonnées de formationRésoudre le problème du déséquilibre des ensembles de donnéesAugmentation des données et recadrage des imagesModèle de formationÉvaluation et mesuresGénérer des explications post hoc à l'aide de CaptumÉvaluer les explications des modèlesLa robustesse des explications post hocConclusionRessources
8. Sélection et débogage des modèles XGBoost
Rafraîchissement des concepts : Débogage MLChoix du modèleAnalyse de sensibilitéAnalyse des résidusRemédiationChoisir un meilleur modèle XGBoostAnalyse de sensibilité pour XGBoostTest de stress XGBoostMéthodologie des tests de résistanceModifier les données pour simuler des conditions de récessionRecherche d'exemples adversesAnalyse des résidus pour XGBoostAnalyse et visualisation des résidusAnalyse d'erreur segmentéeModélisation des résidusRemédier au modèle choisiTrop d'importance accordée à PAY_0Insectes diversConclusionRessources
9. Débogage d'un classificateur d'images PyTorch
Rafraîchissement des concepts : Déboguer le Deep LearningDébogage d'un classificateur d'images PyTorchQualité des données et fuitesTests de logiciels pour le Deep LearningAnalyse de sensibilité pour le Deep LearningRemédiationCorrection de la sensibilitéConclusionRessources
10. Tester et corriger les biais avec XGBoost
Rafraîchissement du concept : Gérer les biais MLModèle de formationÉvaluer les modèles pour déterminer s'ils sont biaisésMéthodes de test pour les groupesÉquité individuelleBiais par procurationRemédier aux préjugésPrétraitementEn cours de traitementPost-traitementChoix du modèleConclusionRessources
11. Red-Teaming XGBoost
Rafraîchissement du conceptTriade de la CIAAttaquesContre-mesuresModèle de formationAttaques pour l'équipe rougeAttaques d'extraction de modèlesExemple d'attaques adversesAttaques des membresEmpoisonnement des donnéesPortes dérobéesConclusionRessources
III. Conclusion
12. Comment réussir dans l'apprentissage automatique à haut risque ?
Qui est dans la pièce ?Science et ingénierieLa méthode scientifique des donnéesLa méthode scientifiqueÉvaluation des résultats publiés et des allégationsAppliquer des normes externesAtténuer les risques avec bon sensConclusionRessources
Index
À propos des auteurs

Content preview from L'apprentissage automatique pour les applications à haut risque

Chapitre 8. Sélection et débogage des modèles XGBoost

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Les moyens utilisés par les scientifiques des données pour mesurer les performances d'un modèle dans le monde réel sont généralement inadéquats. Selon "Underspecification Presents Challenges for Credibility in Modern Machine Learning", rédigé par 40 chercheurs de Google et d'autres grandes institutions de recherche sur l'apprentissage automatique, "les modèles ML présentent souvent un comportement inattendu et médiocre lorsqu'ils sont déployés dans des domaines du monde réel." Un problème fondamental est que nous mesurons la performance comme si nous écrivions des articles de recherche, peu importe la complexité et le risque élevé du scénario de déploiement. Les mesures des données de test comme la précision ou l'aire sous la courbe (AUC) ne nous disent pas grand-chose sur l'équité, la confidentialité, la sécurité ou la stabilité. Ces simples mesures de la qualité de la prédiction ou de l'erreur sur des ensembles de tests statiques ne sont pas suffisamment informatives pour la gestion des risques. Elles ne sont que corrélées aux performances dans le monde réel, et ne garantissent pas de bonnes performances lors du déploiement. En clair, nous devrions nous préoccuper davantage des performances in vivo et de la gestion des risques que des performances des données de test in silico, car l'un des principaux ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Concevoir des applications à forte intensité de données (French Edition), 2nd Edition

Publisher Resources

ISBN: 9798341610576

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

L'apprentissage automatique pour les applications à haut risque

by Patrick Hall, James Curtis, Parul Pandey

Chapitre 8. Sélection et débogage des modèles XGBoost

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.