book

Generative Deep Learning, 2ª Edição

Name: Generative Deep Learning, 2ª Edição
Author: David Foster
ISBN: 9798341641273

by David Foster

April 2025

Intermediate to advanced

456 pages

11h 35m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Read now

Unlock full access

Prefácio
Prefácio
Objetivo e abordagemPré-requisitosMapa rodoviárioAlterações na segunda ediçãoOutros recursosConvenções utilizadas neste livroBase de códigoUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos
I. Introdução à Deep Learning generativa
1. Modelação generativa
O que é a modelação generativa?Modelação generativa versus discriminativaA ascensão da modelação generativaModelação generativa e IAO nosso primeiro modelo generativoOlá mundo!A estrutura de modelação generativaAprendizagem de representaçõesTeoria da probabilidade básicaTaxonomia de modelos generativosA base de código da Deep Learning generativaClonar o repositórioUtiliza o DockerExecutando em uma GPUResumo
2. Deep Learning
Dados para Deep LearningRedes neurais profundasO que é uma Network+?Aprende caraterísticas de alto nívelTensorFlow e KerasPerceptron multicamada (MLP)Preparar os dadosConstruir o modeloCompilar o modeloTreinar o modeloAvaliação do modeloRede Neural Convolucional (CNN)Camadas convolucionaisNormalização de lotesAbandonoConstruir a CNNFormação e avaliação da CNNResumo
II. Métodos
3. Autoencodificadores variacionais
IntroduçãoAuto-codificadoresO conjunto de dados Fashion-MNISTA arquitetura do AutoencoderO codificadorO descodificadorUnir o codificador ao descodificadorReconstrução de imagensVisualiza o espaço latenteGeração de novas imagensAutoencodificadores variacionaisO codificadorA função de perdaTreinar o Autoencoder VariacionalAnálise do Autoencoder VariacionalExplorar o espaço latenteO conjunto de dados CelebATreinar o Autoencoder VariacionalAnálise do Autoencoder VariacionalGerar novos rostosAritmética do espaço latenteTransformação de rostosResumo
4. Redes Adversariais Generativas
IntroduçãoGAN convolucional profundo (DCGAN)O conjunto de dados BricksO DiscriminadorO geradorFormação do DCGANAnálise do DCGANFormação em GAN: Dicas e truquesWasserstein GAN com penalidade de gradiente (WGAN-GP)Perda de WassersteinA restrição de LipschitzAplicar a restrição de LipschitzA perda por penalização do gradienteFormação do WGAN-GPAnálise do WGAN-GPGAN condicional (CGAN)Arquitetura da CGANFormação da CGANAnálise da CGANResumo
5. Modelos Autoregressivos
IntroduçãoRede de memória de curto prazo longa (LSTM)O conjunto de dados de receitasTrabalhar com dados de textoTokenizaçãoCriar o conjunto de treinoA arquitetura LSTMA camada de incorporaçãoA camada LSTMA célula LSTMTreina o LSTMAnálise do LSTMExtensões da Rede Neuronal Recorrente (RNN)Redes Recorrentes EmpilhadasUnidades recorrentes fechadasCélulas bidireccionaisPixelCNNCamadas convolucionais mascaradasBlocos residuaisTreinar o PixelCNNAnálise do PixelCNNDistribuições de misturasResumo
6. Normalização de modelos de fluxo
IntroduçãoNormalização de fluxosMudança de variáveisO determinante JacobianoA equação de mudança de variáveisRealNVPO conjunto de dados das duas luasCamadas de acoplamentoTreinar o modelo RealNVPAnálise do modelo RealNVPOutros modelos de fluxo de normalizaçãoGLOWFFJORDResumo

7. Modelos baseados na energia
IntroduçãoModelos baseados na energiaO conjunto de dados MNISTA função de energiaAmostragem usando a dinâmica de LangevinFormação com Divergência ContrastivaAnálise do modelo baseado na energiaOutros modelos baseados na energiaResumo
8. Modelos de difusão
IntroduçãoModelos de difusão de redução de ruído (DDM)O conjunto de dados das floresO processo de difusão progressivaO truque da reparametrizaçãoCalendários de difusãoO processo de difusão inversaO modelo de redução de ruído U-NetTreinar o modelo de difusãoAmostragem do modelo de difusão de redução de ruídoAnálise do modelo de difusãoResumo
III. Aplicações
9. Transformadores
IntroduçãoGPTO conjunto de dados de críticas de vinhosPresta atençãoConsultas, chaves e valoresAtenção a várias cabeçasMascaramento causalO bloco do transformadorCodificação posicionalFormação GPTAnálise de GPTOutros transformadoresT5GPT-3 e GPT-4ConversaGPTResumo
10. GANs avançados
IntroduçãoProGANTreino progressivoSaídasEstiloGANA Rede de MapeamentoA Rede de SínteseSaídas do StyleGANEstiloGAN2Modulação e desmodulação de pesosRegularização do comprimento do caminhoNão há crescimento progressivoSaídas do StyleGAN2Outros GANs importantesGAN de auto-atenção (SAGAN)BigGANVQ-GANViT VQ-GANResumo
11. Geração musical
IntroduçãoTransformers for Music GenerationO conjunto de dados da suite para violoncelo de BachAnalisar ficheiros MIDITokenizaçãoCriar o conjunto de treinoCodificação de posição senoidalEntradas e saídas múltiplasAnálise do transformador gerador de músicaTokenização de música polifónicaMuseGANO conjunto de dados do Coral de BachO gerador MuseGANO crítico do MuseGANAnálise do MuseGANResumo
12. Modelos Mundiais
IntroduçãoAprendizagem por reforçoO ambiente CarRacingVisão geral do modelo mundialArquiteturaFormaçãoRecolha de dados de lançamento aleatórioFormação da VAEA Arquitetura VAEExplorando o VAERecolha de dados para treinar o MDN-RNNTreinar o MDN-RNNA arquitetura MDN-RNNAmostragem da MDN-RNNFormação do controladorA arquitetura do controladorCMA-ESParalelização do CMA-ESFormação em sonhosResumo
13. Modelos multimodais
IntroduçãoDALL.E 2ArquiteturaO codificador de textoCLIPO PriorO descodificadorExemplos de DALL.E 2ImagemArquiteturaDrawBenchExemplos da ImagenDifusão estávelArquiteturaExemplos de difusão estávelFlamingoArquiteturaO codificador de visãoO reamplificador do recetorO modelo linguísticoExemplos de FlamingoResumo
14. Conclusão
Linha cronológica da IA generativa2014-2017: A era VAE e GAN2018-2019: A Era dos Transformers2020-2022: A era dos grandes modelosO estado atual da IA generativaModelos de línguas grandesModelos de texto para códigoModelos de texto para imagemOutras aplicaçõesO futuro da IA generativaIA generativa na vida quotidianaIA generativa no local de trabalhoIA generativa na educaçãoÉtica e desafios da IA generativaConsiderações finais
Índice
Sobre o autor

Content preview from Generative Deep Learning, 2ª Edição

Parte III. Aplicações

Na Parte III, exploraremos algumas das principais aplicações das técnicas de modelação generativa que vimos até agora, em imagens, texto, música e jogos. Veremos também como estes domínios podem ser percorridos utilizandomodelos multimodais de última geração.

No Capítulo 9, vamos voltar a nossa atenção para Transformers, uma arquitetura de ponta que alimenta a maioria dos modelos modernos de geração de texto. Em particular, exploraremos o funcionamento interno do GPT e construiremos a nossa própria versão utilizando Keras, e veremos como constitui a base de ferramentas como o ChatGPT.

No Capítulo 10, analisaremos algumas das arquitecturas GAN mais importantes que influenciaram a geração de imagens, incluindo ProGAN, StyleGAN, StyleGAN2, SAGAN, BigGAN, VQ-GAN e ViT VQ-GAN. Exploraremos as principais contribuições de cada uma delas e procuraremos compreender como a técnica evoluiu ao longo do tempo.

O Capítulo 11 analisa a geração de música, que apresenta desafios adicionais, como a modelação do tom e do ritmo musicais. Veremos que muitas das técnicas que funcionam para a geração de texto (como Transformers) também podem ser aplicadas neste domínio, mas também exploraremos uma arquitetura de aprendizagem profunda conhecida como MuseGAN que aplica uma abordagem baseada em GAN para gerar música.

O Capítulo 12 mostra como os modelos generativos podem ser utilizados noutros domínios da aprendizagem automática, como a aprendizagem por reforço. Concentrar-nos-emos ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Aprendizagem automática prática com Scikit-Learn, Keras e TensorFlow, 3ª edição

Publisher Resources

ISBN: 9798341641273

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Generative Deep Learning, 2ª Edição

by David Foster

Parte III. Aplicações

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.