book

Deep learning génératif

Name: Deep learning génératif
Author: David Foster
ISBN: 9782412092699

by David Foster, Dominique Maniez

February 2024

Intermediate to advanced

456 pages

12h 6m

French

Editions First

Read now

Unlock full access

Couverture
Deep learning génératif
Copyright
Dédicace
Avant-propos
Préface
Objectifs et approchePrérequisPlan de l’ouvrageChangements dans la deuxième éditionAutres ressourcesConventions utilisées dans ce livreItaliquePolice à espacement fixePolice à espacement fixe en italiqueExemples de codeFigures du livreNote du traducteurRemerciements
Partie 1. Introduction au deep learning génératif
Chapitre 1. Modélisation générative
Qu’est-ce que la modélisation générative ?Modélisation générative ou discriminanteL’essor de la modélisation générativeModélisation générative et IANotre premier modèle génératifHello World !Cadre théorique de modélisation générativeApprentissage par représentationBases de la théorie des probabilitésEspace d’échantillonnageFonction de densité de probabilitéModélisation paramétriqueProbabilitéEstimation de la probabilité maximaleClassification des modèles génératifsBase de code du livreClonage du dépôtUtilisation de DockerExécution sur un GPUEn résumé
Chapitre 2. Deep learning
Données pour le deep learningRéseaux de neurones profondsQu’est-ce qu’un réseau de neurones ?Apprentissage des caractéristiques de haut niveauTensorFlow et KerasPerceptron multicouche (MLP)Préparation des donnéesConstruction du modèleCouchesFonctions d’activationInspection du modèleCompilation du modèleFonctions de perteOptimiseursEntraînement du modèleÉvaluation du modèleRéseau de neurones convolutif (CNN)Couches convolutivesStridePaddingEmpilement de couches convolutivesInspection du modèleNormalisation par lotsDécalage de covariableEntraînement à l’aide de la normalisation par lotsPrédiction à l’aide de la normalisation par lotsDropoutCréation du CNNEntraînement et évaluation du CNNEn résumé
Partie 2. Méthodes

Chapitre 3. Autoencodeurs variationnels
IntroductionAutoencodeursJeu de données Fashion-MNISTArchitecture de l’autoencodeurEncodeurDécodeurLiaison de l’encodeur au décodeurReconstruction des imagesVisualisation de l’espace latentGénération de nouvelles imagesAutoencodeurs variationnelsEncodeurz_meanz_log_varConstruction de l’encodeur VAEFonction de perteEntraînement de l’autoencodeur variationnelAnalyse de l’autoencodeur variationnelExploration de l’espace latentJeu de données CelebAEntraînement de l’autoencodeur variationnelAnalyse de l’autoencodeur variationnelGénération de nouveaux visagesArithmétique de l’espace latentMorphing entre les visagesEn résumé
Chapitre 4. Réseaux antagonistes génératifs
IntroductionGAN convolutif profond (DCGAN)Jeu de données sur les briques LEGODiscriminateurGénérateurEntraînement du DCGANAnalyse du DCGANEntraînement du GAN : conseils et astucesLe discriminateur prend le pouvoir sur le générateurLe générateur prend le pouvoir sur le discriminateurFonction de perte non informativeHyperparamètresRelever les défis des GANGAN de Wasserstein avec pénalité de gradientPerte de WassersteinContrainte de LipschitzApplication de la contrainte de LipschitzFonction de perte avec pénalité de gradientEntraînement du WGAN-GPAnalyse du WGAN-GPGAN conditionnel (CGAN)Architecture d’un CGANEntraînement du CGANAnalyse du CGANEn résumé
Chapitre 5. Modèles autorégressifs
IntroductionRéseau LSTMJeu de données de recettes de cuisineTravailler avec des données textuellesTokenisationCréation du jeu d’entraînementArchitecture d’un LSTMCouche EmbeddingCouche LSTMCellule LSTMEntraînement du LSTMAnalyse du LSTMExtensions des réseaux de neurones récurrents (RNN)Réseaux récurrents empilésUnités récurrentes à portesCellules bidirectionnellesPixelCNNCouches convolutives masquéesBlocs résiduelsEntraînement du PixelCNNAnalyse du PixelCNNDistributions mixtesEn résumé
Chapitre 6. Modèles de flux de normalisation
IntroductionFlux de normalisationChangement de variablesDéterminant jacobienÉquation de changement de variablesRealNVPJeu de données des deux lunesCouches de couplageTransmission des données par l’intermédiaire d’une couche de couplageEmpilement de couches de couplageEntraînement du modèle RealNVPAnalyse du modèle RealNVPAutres modèles de flux de normalisationGLOWFFJORDEn résumé
Chapitre 7. Modèles basés sur l’énergie
IntroductionModèles basés sur l’énergieJeu de données MNISTFonction énergétiqueÉchantillonnage à l’aide de la dynamique de LangevinEntraînement avec divergence contrastiveAnalyse du modèle basé sur l’énergieAutres modèles basés sur l’énergieEn résumé
Chapitre 8. Modèles de diffusion
IntroductionDDMDataset sur les fleursProcessus de diffusion directAstuce de reparamétrisationOrdonnancement des diffusionsProcessus de diffusion inverseModèle de débruitage U-NetEmbedding sinusoïdalResidualBlockDownBlocks et UpBlocksEntraînement du modèle de diffusionÉchantillonnage à partir du modèle de diffusion de débruitageAnalyse du modèle de diffusionGénérer des imagesRéglage du nombre d’étapes de diffusionInterpolation entre les imagesEn résumé
Partie 3. Applications
Chapitre 9. Transformeurs
IntroductionGPTJeu de données de critiques sur les vinsAttentionRequêtes, clés et valeursAttention multi-têteMasque causalBloc TransformerEncodage positionnelEntraînement du modèle GPTAnalyse du modèle GPTGénération du texteVisualisation des scores d’attentionAutres transformeursT5GPT-3 et GPT-4ChatGPTEn résumé
Chapitre 10. GAN avancés
IntroductionProGANEntraînement progressifÉcart type des mini-lotsTaux d’apprentissage égalisésNormalisation au niveau des pixelsSortiesStyleGANRéseau de mise en correspondanceRéseau de synthèseAdaINMélange de stylesVariation stochastiqueProductions du modèle StyleGANStyleGAN2Modulation et démodulation des poidsRégularisation de la longueur du cheminPas de croissance progressiveProductions du modèle StyleGAN2Autres GAN importantsSAGANBigGANVQ-GANViTVQ-GANEn résumé
Chapitre 11. Génération de musique
IntroductionTransformeurs pour la génération musicaleJeu de données des Suites pour violoncelle de BachAnalyse des fichiers MIDITokenisationCréation du jeu d’entraînementEncodage de la position à l’aide d’un sinusEntrées et sorties multiplesAnalyse du Transformer générateur de musiqueTokenisation de la musique polyphoniqueTokenisation par grilleTokenisation basée sur les événementsMuseGANJeu de données sur les chorals de BachGénérateur MuseGANRéseau temporelAccords, style, mélodie et grooveAccordsStyleMélodieGrooveGénérateur de mesuresAssemblage de l’ensembleCritique MuseGANAnalyse de MuseGANEn résumé
Chapitre 12. Modèles du monde
IntroductionApprentissage par renforcementEnvironnementAgentÉtat du jeuActionRécompenseÉpisodeIntervalle de tempsEnvironnement CarRacingÉtat du jeuActionRécompenseÉpisodeAperçu du concept de modèle du mondeArchitectureVMCVAEMDN-RNNContrôleurEntraînementCollecte de données aléatoiresparallel_processesmax_trialsmax_framesEntraînement du VAEvae_batch_sizez_sizevae_num_epochArchitecture du VAEvaeencode_mu_logvarencodedecodeExploration du VAEModèle VAEModèles d’encodeursModèle de décodeurCollecte de données pour entraîner le MDN-RNNEntraînement du MDN-RNNrnn_batch_sizernn_num_stepsArchitecture MDN-RNNÉchantillonnage du MDN-RNNEntraînement du contrôleurVoici les hyperparamètres de cette étape du processuscontroller_num_workercontroller_num_worker_trialcontroller_num_episodecontroller_eval_stepsArchitecture du contrôleurCMA-ESParallélisation de CMA-ESEntraînement dans un environnement imaginaireEn résumé
Chapitre 13. Modèles multimodaux
IntroductionDALL.E 2ArchitectureEncodeur de texteCLIPPriorPrior autorégressifPrior de diffusionDécodeurGLIDESuréchantillonneurExemples d’images générées par DALL.E 2Variantes d’imagesImportance du priorLimitesImagenArchitectureDrawBenchAlignementFidélitéExemples d’images générées par ImagenStable DiffusionArchitectureExemples d’images générées par Stable DiffusionFlamingoArchitectureEncodeur de visionRééchantillonneur de perceptionModèle de langageExemples de productions de FlamingoEn résumé
Chapitre 14. Conclusion
Chronologie de l’IA générative2014-2017 : l’ère des VAE et des GAN2018-2019 : l’ère des modèles Transformer2020-2022 : l’ère des grands modèlesÉtat actuel de l’IA générativeGrands modèles de langageModèles de conversion du texte en codeModèles texte-imageAutres applicationsL’avenir de l’IA générativeL’IA générative dans la vie quotidienneL’IA générative sur le lieu de travailPublicitéProduction musicaleArchitectureModeConception automobileProduction de films et de vidéosRecherche pharmaceutiqueCréation littéraireConception de jeuxConception numériqueL’IA générative dans l’éducationÉthique et défis de l’IA générativeRéflexions finales
Annexe
Sommaire

Content preview from Deep learning génératif

CHAPITRE 13 Modèles multimodaux

Objectifs du chapitre :

• Apprendre ce que l’on entend par modèle multimodal.

• Explorer les rouages de DALL.E 2, un modèle texte-image créé par OpenAI.

• Comprendre comment CLIP et les modèles de diffusion tels que GLIDE jouent un rôle d’intégrateur dans l’architecture de DALL.E 2.

• Analyser les limites de DALL.E 2 signalées par les auteurs de l’article.

• Explorer l’architecture d’Imagen, un modèle texte-image créé par Google Brain.

• Découvrir le processus de diffusion latente utilisé par Stable Diffusion, un modèle texte-image open source.

• Comprendre les similitudes et les différences entre DALL.E 2, Imagen et Stable Diffusion.

• Étudier DrawBench, une suite d’outils comparatifs permettant d’évaluer les modèles ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9782412092699

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Deep learning génératif

by David Foster, Dominique Maniez

CHAPITRE 13 Modèles multimodaux

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.