Parte III. Aplicações
Na Parte III, exploraremos algumas das principais aplicações das técnicas de modelação generativa que vimos até agora, em imagens, texto, música e jogos. Veremos também como estes domínios podem ser percorridos utilizandomodelos multimodais de última geração.
No Capítulo 9, vamos voltar a nossa atenção para Transformers, uma arquitetura de ponta que alimenta a maioria dos modelos modernos de geração de texto. Em particular, exploraremos o funcionamento interno do GPT e construiremos a nossa própria versão utilizando Keras, e veremos como constitui a base de ferramentas como o ChatGPT.
No Capítulo 10, analisaremos algumas das arquitecturas GAN mais importantes que influenciaram a geração de imagens, incluindo ProGAN, StyleGAN, StyleGAN2, SAGAN, BigGAN, VQ-GAN e ViT VQ-GAN. Exploraremos as principais contribuições de cada uma delas e procuraremos compreender como a técnica evoluiu ao longo do tempo.
O Capítulo 11 analisa a geração de música, que apresenta desafios adicionais, como a modelação do tom e do ritmo musicais. Veremos que muitas das técnicas que funcionam para a geração de texto (como Transformers) também podem ser aplicadas neste domínio, mas também exploraremos uma arquitetura de aprendizagem profunda conhecida como MuseGAN que aplica uma abordagem baseada em GAN para gerar música.
O Capítulo 12 mostra como os modelos generativos podem ser utilizados noutros domínios da aprendizagem automática, como a aprendizagem por reforço. Concentrar-nos-emos ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access