book

IA generativa prática com transformadores e modelos de difusão

Name: IA generativa prática com transformadores e modelos de difusão
ISBN: 9798341637825

by Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker

March 2025

Intermediate to advanced

418 pages

11h 47m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Read now

Unlock full access

Prefácio
Quem deve ler este livroPré-requisitosO que vais aprenderComo ler este livroRequisitos de software e hardwareConvenções utilizadas neste livroUtilizar exemplos de códigoComo contactar-nosO estado da arte: Um alvo em movimentoAgradecimentosJonathanApolinárioPedroOmar
I. Tirar partido dos modelos abertos
1. Uma introdução aos media generativos
Geração de imagensGeração de textoGerar clips de somImplicações éticas e sociaisOnde estivemos e em que pé estamosComo são criados os modelos de IA generativa?Resumo
2. Transformadores
Um modelo linguístico em açãoTokenização de textoPrevisão de probabilidadesGeração de textoGeneralização Zero-ShotGeneralização de poucos disparosUm bloco de transformadorGenealogia do modelo do transformadorTarefas de seqüência para seqüênciaModelos só com codificadorO poder da pré-treinoRecapitulação de TransformersLimitaçõesPara além do textoHora do Projeto: Utilizar as LMs para Gerar TextoResumoExercíciosDesafiosReferências
3. Compressão e representação da informação
AutoEncodificadoresPreparar os dadosModelação do codificadorDescodificadorFormaçãoExplorar o espaço latenteVisualiza o espaço latenteAutoEncodificadores VariacionaisCodificadores e descodificadores VAEAmostragem da distribuição do codificadorFormação da VAEVAEs para modelação generativaCLIPPerda por contrasteUtilizar o CLIP, passo a passoClassificação de imagens Zero-Shot com CLIPPipeline de classificação de imagens de disparo zeroCasos de utilização do CLIPAlternativas ao CLIPTempo de Projeto: Pesquisa Semântica de ImagensResumoExercíciosDesafiosReferências
4. Modelos de difusão
A ideia-chave: Refinamento iterativoTreinar um modelo de difusãoOs dadosAdicionar ruídoA UNetFormaçãoAmostragemAvaliaçãoAprofunda-te: Horários de ruídoPorquê adicionar ruído?Começa de forma simplesA matemáticaEfeito da resolução e escala de entradaAprofunda-te: UNets e alternativasUma UNet simplesMelhorar a UNetArquitecturas alternativasEm profundidade: Objectivos de difusãoTempo de Projeto: Treina o teu Modelo de DifusãoResumoExercíciosDesafiosReferências
5. Difusão estável e geração condicional
Adicionar controlo: Modelos de difusão condicionalPreparar os dadosCriação de um modelo condicionado por classeTreinar o modeloAmostragemMelhorar a eficiência: Difusão latenteDifusão estável: Componentes em profundidadeO codificador de textoO AutoEncodificador VariacionalA UNetDifusão estável XLFLUX, SD3 e VídeoOrientação sem classificadoresJunta tudo: Anotação do loop de amostragemDados abertos, modelos abertosDesafios e o ocaso do LAION-5BAlternativasUtilização justa e comercialTempo de Projeto: Constrói uma Demonstração ML Interactiva com o GradioResumoExercíciosDesafioReferências
II. Aprendizagem por transferência para modelos generativos
6. Afinação dos modelos linguísticos
Classificar o textoIdentifica um conjunto de dadosDefine o tipo de modelo a utilizarSeleciona um bom modelo de basePré-processa o conjunto de dadosDefine as métricas de avaliaçãoTreina o modeloAinda és relevante?Geração de textoEscolher o modelo generativo corretoTreinar um modelo generativoInstruçõesUma rápida introdução aos adaptadoresUma introdução ligeira à quantizaçãoJuntar tudoUm mergulho mais profundo na avaliaçãoTempo de Projeto: Geração Aumentada por RecuperaçãoResumoExercíciosDesafioReferências
7. Afinação da difusão estável
Afinação da difusão totalmente estávelPreparar o conjunto de dadosAfinar o modeloInferênciaDreamBoothPreparar o conjunto de dadosPreservação préviaDreamBoothing o modeloInferênciaFormação de LORAsDotar a difusão estável de novas capacidadesPintarEntradas adicionais para condicionamentos especiaisTempo de Projeto: Treina um SDXL DreamBooth LoRA por ti próprioResumoExercíciosDesafioReferências

III. Vai mais longe
8. Aplicações criativas dos modelos texto-imagem
Imagem para imagemPintarPonderação do prompt e edição de imagensPonderação e fusão de promptsEdição de imagens de difusão com orientação semânticaEdição de imagens reais através de inversãoEditar com LEDITS++Edição de imagens reais através do ajuste fino das instruçõesControlNetPrompting de imagem e variações de imagemVariações de imagemPrompting de imagensTempo de Projeto: A tua tela criativaResumoExercíciosReferências
9. Gerar áudio
Dados áudioFormas de ondaEspectrogramasConversão de voz em texto com arquitecturas baseadas em transformadoresTécnicas baseadas em codificadoresTécnicas de codificador-decodificadorDo modelo à tubagemAvaliaçãoDo texto ao discurso e ao áudio generativoGeração de áudio com modelos sequência a sequênciaGo beyond Speech with BarkAudioLM e MusicLMAudioGen e MusicGenDifusão e difusão de áudioDifusão da dançaMais informações sobre modelos de difusão para áudio generativoAvaliação dos sistemas de geração de áudioO que vais fazer a seguir?Duração do projeto: Sistema de conversação de ponta a pontaResumoExercíciosDesafiosReferências
10. Áreas de rápido avanço na IA generativa
Otimização de preferênciasContextos longosMistura de peritosOptimizações e quantizaçõesDadosUm modelo para governar todos elesVisão computacionalVisão computacional 3DGeração de vídeoMultimodalidadeComunidade
A. Ferramentas de fonte aberta
A pilha de rostos abraçadosDadosInvólucrosInferência localFerramentas de implementação
B. Requisitos de Memória do LLM
Requisitos de memória de inferênciaRequisitos da memória de treinoLer mais
C. Recuperação de ponta a ponta - Geração aumentada
Processamento dos dadosIncorporar os documentosRecuperaçãoGeraçãoRAG de nível de produção
Índice
Sobre os autores

Content preview from IA generativa prática com transformadores e modelos de difusão

Capítulo 2. Transformadores

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Muitos atribuem a mais recente vaga de avanços na IA generativa à introdução de uma classe de modelos denominados transformadores em 2017. As suas aplicações mais conhecidas são os poderosos modelos de linguagem de grande dimensão (LLMs), como o Llama e o GPT-4, utilizados por centenas de milhões de pessoas diariamente. Os transformadores tornaram-se a espinha dorsal das aplicações modernas de IA, alimentando tudo, desde chatbots e sistemas de pesquisa a tradução automática e resumo de conteúdos. Até se ramificaram para além do texto, fazendo ondas em campos como a Visão por Computador, geração de música e dobragem de proteínas. Neste capítulo, vamos explorar as principais ideias por trás dos transformadores e como eles funcionam, com foco em uma das aplicações mais comuns: modelagem de linguagem.

Antes de mergulharmos nos detalhes dos transformadores, vamos dar um passo atrás e entender o que é modelagem de linguagem. Na sua essência, um modelo de linguagem (LM) é um modelo probabilístico que aprende a prever a palavra seguinte (ou token) numa sequência com base nas palavras anteriores ou circundantes. Ao fazê-lo, capta a estrutura e os padrões subjacentes da língua, permitindo ao modelo gerar texto realista e coerente. Por exemplo, dada a frase "Comecei o meu dia a comer", um LM pode prever a palavra seguinte como "pequeno-almoço" ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Construindo sistemas de aprendizado de máquina com um armazenamento de recursos

Publisher Resources

ISBN: 9798341637825

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

IA generativa prática com transformadores e modelos de difusão

by Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker

Capítulo 2. Transformadores

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.