book

Engenharia prompt para IA generativa

Name: Engenharia prompt para IA generativa
ISBN: 9798341637245

by James Phoenix, Mike Taylor

March 2025

Intermediate to advanced

422 pages

10h 54m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefácio
Requisitos de software para este livroConvenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos
1. Os Cinco Princípios do Prompting
Visão geral dos cinco princípios do prompt1. Dá uma direção2. Especifica o formato3. Apresenta exemplos4. Avalia a qualidade5. Divide o trabalhoResumo
2. Introdução aos modelos de linguagem de grande dimensão para a geração de texto
O que são modelos de geração de texto?Representações vetoriais: A Essência Numérica da LinguagemArquitetura de Transformação: Orquestração de relações contextuaisGeração de texto probabilístico: O mecanismo de decisãoFundamentos históricos: A ascensão das arquitecturas de transformadorTransformadores pré-treinados generativos da OpenAIGPT-3.5-turbo e ChatGPTGPT-4Gemini da GoogleA Lhama da Meta e o código abertoAproveitamento da quantização e do LoRAMistralAntropica: ClaudeGPT-4V(isão)Comparação de modelosResumo
3. Práticas padrão para a geração de texto com o ChatGPT
Geração de listasGeração de listas hierárquicasQuando evitar a utilização de expressões regularesGerar JSONYAMLFiltragem de cargas YAMLManipulação de cargas inválidas em YAMLGeração de formatos diversificados com o ChatGPTSimulação de dados CSVExplica como se eu tivesse cinco anosTradução universal através dos LLMsPergunta pelo contextoSeparação de estilos de textoIdentificar as caraterísticas textuais desejadasGeração de novos conteúdos com as caraterísticas extraídasExtração de caraterísticas textuais específicas com LLMsSumarizaçãoResumir as limitações de uma janela de contextoSeparação de textoVantagens de dividir o texto em partesCenários para fragmentar o textoExemplo de fragmentação deficienteEstratégias de fragmentaçãoDeteção de frases utilizando o SpaCyConstrói um Algoritmo de Chunking Simples em PythonJanelas de correr com trincosPacotes de fragmentação de textoSeparação de texto com TiktokenCodificaçõesEntendendo a Tokenização de StringsEstimativa do uso de token para chamadas à API de chatAnálise de sentimentosTécnicas para melhorar a análise de sentimentosLimitações e desafios da análise de sentimentosDo menos ao maisPlanear a arquiteturaCodificação de funções individuaisAdicionar testesVantagens da técnica do mínimo ao máximoDesafios com a técnica do menos ao maisPrompting de funçõesBenefícios do Role PromptingDesafios do Role PromptingQuando utilizar o prompt de funçãoTácticas de prompt do GPTEvitar alucinações com referênciaDá aos GPTs "tempo para pensar"A tática do monólogo interiorRespostas de autoavaliação do LLMClassificação com LLMsCriar um modelo de classificaçãoVoto por maioria para a classificaçãoAvaliação dos critériosMeta PromptingResumo
4. Técnicas avançadas de geração de texto com LangChain
Introdução à LangChainConfiguração do ambienteModelos de chatModelos de chat em fluxo contínuoCriar várias gerações de LLMModelos de prompt LangChainLinguagem de Expressão LangChain (LCEL)Usando PromptTemplate com modelos de chatAnalisadores de saídaAvaliações LangChainChamada de funções OpenAIChamada de função paralelaChamada de funções em LangChainExtrair dados com LangChainPlaneamento de consultasCriar modelos de prompt de poucas fotosExemplos de poucos disparos de comprimento fixoFormatar os exemplosSeleção de exemplos de poucos disparos por comprimentoLimitações com exemplos de poucos disparosGuardar e carregar prompts LLMLigação de dadosCarregadores de documentosSeparadores de textoDivisão de texto por comprimento e tamanho de tokenDivisão de texto com divisão recursiva de caracteresDecomposição de tarefasEncadeamento promptCadeia sequencialitemgetter e extração de chave de dicionárioEstruturação das cadeias LCELCadeias de documentosCoisasRefinarRedução de mapasRe-ranquear mapaResumo
5. Bases de dados vetoriais com FAISS e Pinecone
Geração Aumentada de Recuperação (RAG)Apresentando EmbeddingsCarregamento de documentosRecuperação de memória com FAISSRAG com LangChainBases de dados vetoriais alojadas com PineconeAuto-questionamentoMecanismos de recuperação alternativosResumo
6. Agentes autónomos com memória e ferramentas
Cadeia de pensamentoAgentesReage e age (ReAct)Aplicação do Raciocínio e do AtoUtilizar ferramentasUtilizar LLMs como uma API (Funções OpenAI)Comparação entre as funções OpenAI e ReactCasos de utilização das funções OpenAIReActCasos de utilização do ReactFerramentas para agentesPersonalização de agentes standardAgentes aduaneiros em LCELCompreender e utilizar a memóriaMemória a longo prazoMemória de curto prazoMemória de curto prazo em agentes de conversação de GQMemória em LangChainPreservar o EstadoConsultar o EstadoConversationBufferMemoryOutros tipos de memória populares em LangChainConversationBufferWindowMemoryConversationSummaryMemory (Memória do resumo da conversa)ConversationSummaryBufferMemoryConversationTokenBufferMemoryFunções do OpenAI Agente com memóriaEstruturas avançadas de agentesAgentes de planeamento e execuçãoÁrvore dos PensamentosChamadas de retornoCallbacks globais (Construtor)Callbacks específicos do pedidoO argumento verbosoQuando utilizar o Which?Contagem de tokens com LangChainResumo
7. Introdução aos modelos de difusão para geração de imagens
OpenAI DALL-EA meio da viagemDifusão estávelGoogle GeminiTexto para vídeoComparação de modelosResumo
8. Práticas normalizadas para a criação de imagens com o Midjourney
Modificadores de formatoModificadores de estilo artísticoPrompts de Engenharia InversaReforços de qualidadePrompts negativosTermos ponderadosPrompting com uma imagemPintarPintura exteriorPersonagens consistentesReescreve o promptSeparação de memesMapeamento de MemeAnálise do promptResumo
9. Técnicas avançadas de geração de imagens com difusão estável
Executa a difusão estávelInterface de utilizador Web AUTOMATIC1111Img2ImgAumentar a escala de imagensInterroga o CLIPSD Inpainting e OutpaintingControlNetModelo de qualquer segmento (SAM)Afinação do DreamBoothRefinador XL de difusão estávelResumo

10. Criar aplicações com IA
Escrever um blogue sobre IAPesquisa sobre o temaEntrevista com o especialistaGerar esboçoGeração de textoEstilo de escritaOtimização do títuloImagens do blogue da IAInterface do utilizadorResumo
Índice
Sobre os autores

Content preview from Engenharia prompt para IA generativa

Capítulo 7. Introdução aos modelos de difusão parageração de imagens

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Este capítulo apresenta os modelos de difusão mais populares para a geração de imagens de IA. Aprenderás as vantagens e limitações de cada um dos principais modelos, para que possas escolher entre eles com base na tarefa que tens em mãos.

Introduzidos em 2015, os modelos de difusão são uma classe de modelos generativos que têm mostrado resultados espectaculares na geração de imagens a partir de texto. O lançamento do DALL-E 2 em 2022 marcou um grande salto em frente na qualidade das imagens geradas a partir de modelos de difusão, com o Stable Diffusion de código aberto e o favorito da comunidade Midjourney rapidamente seguindo para forjar uma categoria competitiva. Com a integração do DALL-E 3 no ChatGPT, as linhas continuarão a esbater-se entre a geração de texto e de imagem. No entanto, os utilizadores avançados continuarão provavelmente a necessitar de acesso direto ao modelo de geração de imagens subjacente, para obterem os melhores resultados.

Os modelos de difusão são treinados através de várias etapas de adição de ruído aleatório a uma imagem e, em seguida, de previsão de como inverter o processo de difusão através da eliminação de ruído. A abordagem vem da física, onde tem sido utilizada para simular a forma como as partículas se difundem (se espalham) através de um meio. As previsões ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341637245

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Engenharia prompt para IA generativa

by James Phoenix, Mike Taylor

Capítulo 7. Introdução aos modelos de difusão parageração de imagens

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.