book

Generative Deep Learning, 2a edizione

by David Foster

April 2025

Intermediate to advanced

456 pages

11h 56m

Italian

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Obiettivo e approccioPrerequisitiMappa stradaleCambiamenti nella seconda edizioneAltre risorseConvenzioni utilizzate in questo libroCodebaseUtilizzo di esempi di codiceFormazione online O'ReillyCome contattarciRingraziamenti
Cos'è la modellazione generativa?Modellazione generativa e discriminativaL'ascesa della modellazione generativaModellazione generativa e IAIl nostro primo modello generativoCiao mondo!Il quadro di modellazione generativaApprendimento della rappresentazioneTeoria della probabilità di baseTassonomia dei modelli generativiLa base di codice per il Deep Learning generativoClonare il repositoryUtilizzo di DockerEsecuzione su GPURiassunto
Dati per il Deep LearningReti neurali profondeCos'è una rete neurale?Apprendimento delle caratteristiche di alto livelloTensorFlow e KerasPercettore multistrato (MLP)Preparazione dei datiCostruire il modelloCompilazione del modelloFormazione del modelloValutazione del modelloRete neurale convoluzionale (CNN)Livelli convoluzionaliNormalizzazione in batchAbbandonoCostruire la CNNFormazione e valutazione della CNNSommario
IntroduzioneAutoencoderIl set di dati Fashion-MNISTL'architettura dell'autoencoderIl codificatoreIl DecoderCollegare il codificatore al decodificatoreRicostruzione delle immaginiVisualizzazione dello spazio latenteGenerare nuove immaginiAutoencoder variazionaliIl codificatoreLa funzione di perditaAddestramento dell'autoencoder variazionaleAnalisi dell'autoencoder variazionaleEsplorare lo spazio latenteIl set di dati CelebAAddestramento dell'autoencoder variazionaleAnalisi dell'autoencoder variazionaleGenerare nuovi voltiAritmetica dello spazio latenteMorphing tra i voltiRiassunto
IntroduzioneGAN convoluzionale profonda (DCGAN)Il set di dati BricksIl DiscriminatoreIl generatoreFormazione del DCGANAnalisi del DCGANFormazione GAN: Suggerimenti e trucchiWasserstein GAN con penalità di gradiente (WGAN-GP)Perdita WassersteinIl vincolo di LipschitzApplicazione del vincolo di LipschitzLa perdita della penalità del gradienteFormazione del WGAN-GPAnalisi del WGAN-GPGAN condizionale (CGAN)Architettura CGANFormazione del CGANAnalisi del CGANRiassunto
IntroduzioneRete di memoria a breve termine (LSTM)Il set di dati delle ricetteLavorare con i dati di testoTokenizzazioneCreare il set di addestramentoL'architettura LSTMIl livello di incorporazioneLo strato LSTMLa cellula LSTMAddestramento dell'LSTMAnalisi dell'LSTMEstensioni della Rete Neurale Ricorrente (RNN)Reti ricorrenti impilateUnità ricorrenti recintateCelle bidirezionaliPixelCNNLivelli convoluzionali mascheratiBlocchi residuiAddestramento della PixelCNNAnalisi della PixelCNNDistribuzioni di misceleRiassunto
IntroduzioneNormalizzazione dei flussiModifica delle variabiliIl determinante jacobianoL'equazione del cambiamento delle variabiliRealNVPIl set di dati delle due luneStrati di accoppiamentoFormazione del modello RealNVPAnalisi del modello RealNVPAltri modelli di flusso normalizzanteGLOWFFJORDRiassunto

IntroduzioneModelli basati sull'energiaIl dataset MNISTLa funzione energiaCampionamento con la dinamica di LangevinFormazione con la divergenza contrastivaAnalisi del modello basato sull'energiaAltri modelli basati sull'energiaRiassunto
IntroduzioneModelli di diffusione del denoising (DDM)Il set di dati sui fioriIl processo di diffusione in avantiIl trucco della riparametrizzazioneOrari di diffusioneIl processo di diffusione inversaIl modello di denoising U-NetFormazione del modello di diffusioneCampionamento dal modello di diffusione del denoisingAnalisi del modello di diffusioneRiassunto
IntroduzioneGPTIl set di dati delle recensioni di vinoAttenzioneQuery, chiavi e valoriAttenzione multi-testaMascheramento causaleIl blocco trasformatoreCodifica posizionaleFormazione GPTAnalisi di GPTAltri trasformatoriT5GPT-3 e GPT-4ChatGPTSommario
IntroduzioneProGANAllenamento progressivoUsciteStileGANLa rete di mappaturaLa Rete di sintesiUscite da StyleGANStileGAN2Modulazione e demodulazione del pesoRegolarizzazione della lunghezza del percorsoNessuna crescita progressivaUscite da StyleGAN2Altri GAN importantiGAN dell'auto-attenzione (SAGAN)BigGANVQ-GANViT VQ-GANRiassunto
IntroduzioneTransformers per la generazione musicaleIl set di dati della suite per violoncello di BachParsing dei file MIDITokenizzazioneCreare il set di addestramentoCodifica della posizione sinusoidaleIngressi e uscite multipleAnalisi del trasformatore per la generazione di musicaTokenizzazione della musica polifonicaMuseGANIl set di dati della Corale di BachIl generatore MuseGANIl critico MuseGANAnalisi di MuseGANSommario
IntroduzioneApprendimento per rinforzoL'ambiente di CarRacingPanoramica del modello mondialeArchitetturaFormazioneRaccolta dei dati di lancio casualeFormazione del VAEL'architettura VAEEsplorare il VAERaccolta dei dati per addestrare l'MDN-RNNAddestramento della MDN-RNNL'architettura MDN-RNNCampionamento dalla MDN-RNNAddestrare il controlloreL'architettura del controllerCMA-ESParallelizzare CMA-ESFormazione In-DreamRiassunto
IntroduzioneDALL.E 2ArchitetturaIl codificatore di testoCLIPIl PrioreIl DecoderEsempi di DALL.E 2ImagenArchitetturaDrawBenchEsempi da ImagenDiffusione stabileArchitetturaEsempi di diffusione stabileFenicotteroArchitetturaL'encoder di visioneIl ricampionatore PerceiverIl modello linguisticoEsempi da FlamingoSommario
Cronologia dell'IA generativa2014-2017: L'era VAE e GAN2018-2019: l'era dei Transformer2020-2022: l'era dei grandi modelliLo stato attuale dell'IA generativaModelli linguistici di grandi dimensioniModelli da testo a codiceModelli da testo a immagineAltre applicazioniIl futuro dell'intelligenza artificiale generativaL'intelligenza artificiale generativa nella vita quotidianaL'IA generativa sul posto di lavoroL'intelligenza artificiale generativa nell'istruzioneEtica e sfide dell'IA generativaPensieri finali

Content preview from Generative Deep Learning, 2a edizione

Parte III. Applicazioni

Nella Parte III esploreremo alcune delle principali applicazioni delle tecniche di modellazione generativa che abbiamo visto finora, tra immagini, testi, musica e giochi. Vedremo anche come questi domini possono essere attraversati utilizzandomodelli multimodali all'avanguardia.

Nel Capitolo 9 ci occuperemo di Transformers, un'architettura all'avanguardia che alimenta la maggior parte dei modelli moderni di generazione del testo. In particolare, esploreremo i meccanismi interni di GPT e costruiremo una nostra versione utilizzando Keras, oltre a vedere come questa architettura sia alla base di strumenti come ChatGPT.

Nel Capitolo 10 analizzeremo alcune delle più importanti architetture GAN che hanno influenzato la generazione di immagini, tra cui ProGAN, StyleGAN, StyleGAN2, SAGAN, BigGAN, VQ-GAN e ViT VQ-GAN. Esploreremo i contributi chiave di ciascuna di esse e cercheremo di capire come la tecnica si è evoluta nel tempo.

Il capitolo 11 analizza la generazione di musica, che presenta ulteriori sfide come la modellazione dell'intonazione e del ritmo musicale. Vedremo che molte delle tecniche che funzionano per la generazione di testi (come Transformers) possono essere applicate anche in questo campo, ma esploreremo anche un'architettura di deep learning nota come MuseGAN che applica un approccio basato su GAN alla generazione di musica.

Il Capitolo 12 mostra come i modelli generativi possono essere utilizzati in altri ambiti dell'apprendimento automatico, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Deep Learning per programmatori con fastai e PyTorch

Publisher Resources

ISBN: 9798341643543Supplemental Content

Generative Deep Learning, 2a edizione

by David Foster

Parte III. Applicazioni

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Deep Learning per programmatori con fastai e PyTorch

Modelli linguistici di grandi dimensioni pratici

Aprendizaje profundo generativo, 2ª edición

Progettazione di applicazioni per modelli linguistici di grandi dimensioni

Publisher Resources

Parte III. Applicazioni

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Deep Learning per programmatori con fastai e PyTorch

Modelli linguistici di grandi dimensioni pratici

Aprendizaje profundo generativo, 2ª edición

Progettazione di applicazioni per modelli linguistici di grandi dimensioni

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.