book

Engenharia prompt para IA generativa

Name: Engenharia prompt para IA generativa
ISBN: 9798341637245

by James Phoenix, Mike Taylor

March 2025

Intermediate to advanced

422 pages

10h 54m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefácio
Requisitos de software para este livroConvenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos
1. Os Cinco Princípios do Prompting
Visão geral dos cinco princípios do prompt1. Dá uma direção2. Especifica o formato3. Apresenta exemplos4. Avalia a qualidade5. Divide o trabalhoResumo
2. Introdução aos modelos de linguagem de grande dimensão para a geração de texto
O que são modelos de geração de texto?Representações vetoriais: A Essência Numérica da LinguagemArquitetura de Transformação: Orquestração de relações contextuaisGeração de texto probabilístico: O mecanismo de decisãoFundamentos históricos: A ascensão das arquitecturas de transformadorTransformadores pré-treinados generativos da OpenAIGPT-3.5-turbo e ChatGPTGPT-4Gemini da GoogleA Lhama da Meta e o código abertoAproveitamento da quantização e do LoRAMistralAntropica: ClaudeGPT-4V(isão)Comparação de modelosResumo
3. Práticas padrão para a geração de texto com o ChatGPT
Geração de listasGeração de listas hierárquicasQuando evitar a utilização de expressões regularesGerar JSONYAMLFiltragem de cargas YAMLManipulação de cargas inválidas em YAMLGeração de formatos diversificados com o ChatGPTSimulação de dados CSVExplica como se eu tivesse cinco anosTradução universal através dos LLMsPergunta pelo contextoSeparação de estilos de textoIdentificar as caraterísticas textuais desejadasGeração de novos conteúdos com as caraterísticas extraídasExtração de caraterísticas textuais específicas com LLMsSumarizaçãoResumir as limitações de uma janela de contextoSeparação de textoVantagens de dividir o texto em partesCenários para fragmentar o textoExemplo de fragmentação deficienteEstratégias de fragmentaçãoDeteção de frases utilizando o SpaCyConstrói um Algoritmo de Chunking Simples em PythonJanelas de correr com trincosPacotes de fragmentação de textoSeparação de texto com TiktokenCodificaçõesEntendendo a Tokenização de StringsEstimativa do uso de token para chamadas à API de chatAnálise de sentimentosTécnicas para melhorar a análise de sentimentosLimitações e desafios da análise de sentimentosDo menos ao maisPlanear a arquiteturaCodificação de funções individuaisAdicionar testesVantagens da técnica do mínimo ao máximoDesafios com a técnica do menos ao maisPrompting de funçõesBenefícios do Role PromptingDesafios do Role PromptingQuando utilizar o prompt de funçãoTácticas de prompt do GPTEvitar alucinações com referênciaDá aos GPTs "tempo para pensar"A tática do monólogo interiorRespostas de autoavaliação do LLMClassificação com LLMsCriar um modelo de classificaçãoVoto por maioria para a classificaçãoAvaliação dos critériosMeta PromptingResumo
4. Técnicas avançadas de geração de texto com LangChain
Introdução à LangChainConfiguração do ambienteModelos de chatModelos de chat em fluxo contínuoCriar várias gerações de LLMModelos de prompt LangChainLinguagem de Expressão LangChain (LCEL)Usando PromptTemplate com modelos de chatAnalisadores de saídaAvaliações LangChainChamada de funções OpenAIChamada de função paralelaChamada de funções em LangChainExtrair dados com LangChainPlaneamento de consultasCriar modelos de prompt de poucas fotosExemplos de poucos disparos de comprimento fixoFormatar os exemplosSeleção de exemplos de poucos disparos por comprimentoLimitações com exemplos de poucos disparosGuardar e carregar prompts LLMLigação de dadosCarregadores de documentosSeparadores de textoDivisão de texto por comprimento e tamanho de tokenDivisão de texto com divisão recursiva de caracteresDecomposição de tarefasEncadeamento promptCadeia sequencialitemgetter e extração de chave de dicionárioEstruturação das cadeias LCELCadeias de documentosCoisasRefinarRedução de mapasRe-ranquear mapaResumo
5. Bases de dados vetoriais com FAISS e Pinecone
Geração Aumentada de Recuperação (RAG)Apresentando EmbeddingsCarregamento de documentosRecuperação de memória com FAISSRAG com LangChainBases de dados vetoriais alojadas com PineconeAuto-questionamentoMecanismos de recuperação alternativosResumo
6. Agentes autónomos com memória e ferramentas
Cadeia de pensamentoAgentesReage e age (ReAct)Aplicação do Raciocínio e do AtoUtilizar ferramentasUtilizar LLMs como uma API (Funções OpenAI)Comparação entre as funções OpenAI e ReactCasos de utilização das funções OpenAIReActCasos de utilização do ReactFerramentas para agentesPersonalização de agentes standardAgentes aduaneiros em LCELCompreender e utilizar a memóriaMemória a longo prazoMemória de curto prazoMemória de curto prazo em agentes de conversação de GQMemória em LangChainPreservar o EstadoConsultar o EstadoConversationBufferMemoryOutros tipos de memória populares em LangChainConversationBufferWindowMemoryConversationSummaryMemory (Memória do resumo da conversa)ConversationSummaryBufferMemoryConversationTokenBufferMemoryFunções do OpenAI Agente com memóriaEstruturas avançadas de agentesAgentes de planeamento e execuçãoÁrvore dos PensamentosChamadas de retornoCallbacks globais (Construtor)Callbacks específicos do pedidoO argumento verbosoQuando utilizar o Which?Contagem de tokens com LangChainResumo
7. Introdução aos modelos de difusão para geração de imagens
OpenAI DALL-EA meio da viagemDifusão estávelGoogle GeminiTexto para vídeoComparação de modelosResumo
8. Práticas normalizadas para a criação de imagens com o Midjourney
Modificadores de formatoModificadores de estilo artísticoPrompts de Engenharia InversaReforços de qualidadePrompts negativosTermos ponderadosPrompting com uma imagemPintarPintura exteriorPersonagens consistentesReescreve o promptSeparação de memesMapeamento de MemeAnálise do promptResumo
9. Técnicas avançadas de geração de imagens com difusão estável
Executa a difusão estávelInterface de utilizador Web AUTOMATIC1111Img2ImgAumentar a escala de imagensInterroga o CLIPSD Inpainting e OutpaintingControlNetModelo de qualquer segmento (SAM)Afinação do DreamBoothRefinador XL de difusão estávelResumo

10. Criar aplicações com IA
Escrever um blogue sobre IAPesquisa sobre o temaEntrevista com o especialistaGerar esboçoGeração de textoEstilo de escritaOtimização do títuloImagens do blogue da IAInterface do utilizadorResumo
Índice
Sobre os autores

Content preview from Engenharia prompt para IA generativa

Capítulo 9. Técnicas avançadas para geração de imagens com difusão estável

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

A maior parte do trabalho com imagens de IA requer apenas técnicas simples de engenharia de prompt, mas existem ferramentas mais poderosas disponíveis quando precisas de um controlo mais criativo sobre o teu resultado ou queres treinar modelos personalizados para tarefas específicas. Estas capacidades mais complexas requerem frequentemente mais capacidade técnica e pensamento estruturado como parte do fluxo de trabalho de criação da imagem final.

Todas as imagens deste capítulo são geradas pelo Stable Diffusion XL, salvo indicação em contrário, como nas secções que dependem de extensões como a ControlNet, onde são suportados mais métodos com o modelo v1.5 mais antigo. As técnicas discutidas foram concebidas para serem transferíveis para qualquer modelo futuro ou alternativo. Utilizamos extensivamente a Stable Diffusion WebUI do AUTOMATIC1111 e fornecemos instruções de configuração detalhadas que estavam actualizadas no momento da escrita, mas por favor consulta o repositório oficial para instruções actualizadas, e para diagnosticar quaisquer problemas que encontres.

Executa a difusão estável

O Stable Diffusion é um modelo de geração de imagens de código aberto, pelo que podes executá-lo localmente no teu computador gratuitamente, se tiveres uma GPU NVIDIA ou AMD, ou Apple Silicon, como ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341637245

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Engenharia prompt para IA generativa

by James Phoenix, Mike Taylor

Capítulo 9. Técnicas avançadas para geração de imagens com difusão estável

Executa a difusão estável

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.