book

Confidentialité et sécurité pour les grands modèles de langage (French Edition)

Name: Confidentialité et sécurité pour les grands modèles de langage (French Edition)
Author: Baihan Lin
ISBN: 0642572313814

by Baihan Lin

January 2026

Intermediate to advanced

318 pages

10h 16m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Préface
À qui s'adresse ce livre ?Pourquoi j'ai écrit ce livreComment utiliser ce livreConventions utilisées dans ce livreUtilisation d'exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciements
1. Introduction
L'essor des grands modèles linguistiquesProblèmes de confidentialité et de sécurité dans les LLMsCe que couvre ce livreVotre rôle dans cette aventureRésumé
2. Comprendre les grands modèles linguistiques
Les bases des grands modèles linguistiquesLes bases des modèles linguistiquesConcepts clés des LLMsArchitectures des LLMArchitecture TransformerArchitecture Mixture of ExpertsModèles LLM populairesTechniques d'entraînement des LLMsTechniques de pré-entraînementTechniques de réglage finGénération augmentée par la récupérationRésumé
3. Évaluer les risques pour la vie privée et la sécurité des LLMs
Mesures de confidentialitéConfidentialité différentiellePerte de confidentialitéAnonymat kConsidérations relatives à la confidentialité dans les systèmes RAGMesures de sécuritéTaux de réussite des attaques (ASR)Taux de faux positifs (FPR) pour l'inférence d'appartenanceErreur de reconstruction pour l'inversion du modèleAudits de confidentialité et de sécurité des LLMSimulation d'attaquesLLMPrivacySecurityEvaluator : l'auditeur tout-en-unCadres d'évaluation et repères modernesRésumé
4. Techniques de formation préservant la confidentialité
Un exemple concret de violation de la confidentialité pendant la phase de formationDonnées synthétiques pour l'évaluation de la confidentialitéComment utiliser LLMPrivacySecurityEvaluator sur tes donnéesConfidentialité différentielle pour les LLMsLes bases mathématiquesMettre en place DP-SGD pour les LLMsLa comptabilité de la confidentialité en pratiqueCompromis et considérationsAppliquer la confidentialité différentielle à la génération augmentée par la récupérationApprentissage fédéré avec les LLMsLe conceptMettre en place l'apprentissage fédéré pour les LLMsAvantages et défis de l'apprentissage fédéréChiffrement homomorphe dans les LLMsLe conceptMettre en place le HE pour les LLMsAvantages et défis du chiffrement homomorpheCalcul multipartite pour une agrégation sécuriséeLe conceptMettre en place le MPC avec des bibliothèques modernesAvantages et défis du MPCRéglage fin efficace des paramètres pour la confidentialitéAdaptation de rang faibleAdaptation quantifiée à faible rangTransformation des données préservant la confidentialitéAnonymisation et dépersonnalisation des donnéesAugmentation des données préservant la confidentialitéAvantages et défis de l'augmentation des données préservant la confidentialité Comprendre les composants de l'infrastructureRésumé
5. Déploiement sécurisé des LLMs
Hébergement et infrastructure sécurisés des modèlesComprendre les composants de l'infrastructureStratégies d'isolationSécurité du réseauGestion et surveillance des ressourcesAPI et communications sécuriséesPrincipes de conception des APIMise en place d'API sécuriséesAuthentification et autorisationCommunication sécuriséeGestion sécurisée des versions et mises à jour des modèlesRegistre des modèles et contrôle des versionsProcessus de mise à jour sécuriséRésumé
6. Attaques adversaires et défenses
Comprendre les attaques adversaires sur les LLMsTaxonomie des attaques adversaires sur les LLMsMéthodes d'attaque notablesAttaques par intégration spatialeAttaques d'agents LLMImpact de la taille et de l'architecture du modèleÉtude de cas : se défendre contre les attaques de jailbreakingTechniques de réglage fin robustesEntraînement antagonisteTechniques d'optimisation robustesAugmentation des données pour plus de robustesseRéglage des préfixes et robustesse basée sur les promptsMéthodes d'ensembleRéglage fin certifié robusteÉquipes rouges pour les LLMsMéthodes de red teamingMettre en place un programme de red teamingOutils et cadres de red teamingRed Teaming automatisé en plusieurs phasesÉtude de cas : le red teaming en pratiqueÉvaluation antagoniste et mesures de robustesseCritères de référence en matière de robustesseRobustesse en cas de changement de distributionÉvaluation avec intervention humaineÉvaluation basée sur les agentsMesures standardisées de réussite des attaquesMesures d'évaluation de la défenseDéfis liés à l'évaluation de la robustesseMeilleures pratiquesOrientations futures en matière de robustesse des LLMRésumé
7. Considérations éthiques dans le réglage fin des LLMs
Problèmes de partialité et d'équité dans la personnalisationComprendre les biais dans les LLMs affinésMesurer l'équité dans les modèles affinésStratégies pour réduire les biaisLes défis de l'atténuation des biais tout en protégeant la vie privéeTransparence et explicabilité dans les modèles ajustésLe défi de l'explicabilité dans les LLMsTechniques pour expliquer le comportement des LLMExpliquabilité tout en respectant la vie privéeLutter contre les biais de l'IA avec des contraintes de confidentialitéLe compromis entre confidentialité et équitéMécanismes de confidentialité tenant compte des groupesApprentissage fédéré tenant compte des biaisAudit des biais respectueux de la vie privéeRésumé
8. Comprendre les contextes culturels, sociaux et juridiques
Un nouveau type de systèmes socio-techniquesNaviguer au milieu d'une évolution culturelle influencée par l'IAL'essor du contenu généré par l'IA et l'érosion de la confianceIA personnalisée et crise d'identité à l'ère du capitalisme de surveillanceQuestions existentielles dans l'interaction homme-machineDécouvrir la chaîne d'approvisionnement de l'IA générativeL'émergence de la culture machineCadres juridiques adaptables pour la réglementation et la responsabilitéLe cas des droits d'auteur et de la propriété intellectuelle à l'ère des LLMsLe cas de la confidentialité et de la protection des données dans les systèmes d'IA personnalisésLe cas des biais algorithmiques et de la discrimination dans la prise de décision basée sur l'IALa question de la responsabilité et de l'obligation de rendre des comptes dans les systèmes basés sur l'IALes défis universels du solutionnisme techno-juridiqueConstruire une culture responsable en matière d'IALa sécurité de l'IA au-delà des algorithmes : les éléments humainsRésumé
9. Développer des capacités d'IA qui protègent la vie privée
L'IA dans le domaine de la santé en action : analyse différenciée et confidentielle des notes cliniquesLe défi de la confidentialité dans le domaine de la santéLes données synthétiques comme base pour préserver la confidentialitéLoRA : un réglage fin efficace et respectueux de la vie privéeComptabilité de la confidentialité avec RDPConsidérations relatives au déploiement dans le monde réelL'IA juridique en action : apprentissage fédéré entre cabinets d'avocats ou tribunauxL'impératif de confidentialité juridiqueArchitecture d'apprentissage fédéré pour l'IA juridiqueAgrégation sécurisée et mises à jour des modèlesConsidérations juridiques et éthiques dans l'IA juridique fédéréeÉvaluation des performances et de l'utilitéDévelopper vos capacités en matière d'IA axée sur la confidentialitéPréparation organisationnelle et stratégie de mise en œuvreStructure de l'équipe et décisions technologiquesIntégration de la gouvernance et mesure du succèsSe préparer au paysage de demain en matière de confidentialitéConvergence technologique et évolution réglementaireDynamique du marché et positionnement concurrentielUne position stratégique pour l'avenirRésuméConclusionLa transformation dont vous avez été témoinLa voie sur laquelle on estVotre rôle dans la construction de l'avenir

Index
À propos de l'auteur

Content preview from Confidentialité et sécurité pour les grands modèles de langage (French Edition)

Chapitre 6. Attaques et défensesadversaires

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Dans le chapitre précédent, tu as vu comment déployer en toute sécurité des LLMs à grande échelle d'un point de vue technique et organisationnel. Tu as examiné plusieurs aspects liés à l'infrastructure, aux modèles de conception d'API et aux mécanismes de contrôle d'accès qui aident à protéger ces modèles puissants dans les environnements de production. Mais même le système le plus soigneusement déployé reste vulnérable si le modèle sous-jacent lui-même peut être manipulé.

Ce chapitre se concentre sur le jeu fascinant du chat et de la souris entre les attaquants et les défenseurs dans le paysage des LLM. Tu vas maintenant te mettre dans la peau d'un adversaire pour comprendre comment ces modèles peuvent être attaqués, puis tu passeras à l'examen des mesures défensives qui peuvent les protéger. Comme d'autres systèmes de Deep Learning, les LLMs sont vulnérables aux attaques adversaires : des entrées soigneusement conçues pour manipuler le comportement du modèle de manière imprévue et potentiellement nuisible.

Les enjeux dans ce domaine sont importants. À mesure que les LLMs s'intègrent de plus en plus dans des applications critiques, des services financiers et des soins de santé à la modération de contenu et aux systèmes de sécurité, leurs vulnérabilités peuvent avoir de graves conséquences. Un attaquant ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Apprentissage automatique probabiliste pour la finance et l'investissement

Publisher Resources

ISBN: 0642572313814

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Confidentialité et sécurité pour les grands modèles de langage (French Edition)

by Baihan Lin

Chapitre 6. Attaques et défensesadversaires

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.