book

Engenharia prompt para IA generativa

Name: Engenharia prompt para IA generativa
ISBN: 9798341637245

by James Phoenix, Mike Taylor

March 2025

Intermediate to advanced

422 pages

10h 54m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefácio
Requisitos de software para este livroConvenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos
1. Os Cinco Princípios do Prompting
Visão geral dos cinco princípios do prompt1. Dá uma direção2. Especifica o formato3. Apresenta exemplos4. Avalia a qualidade5. Divide o trabalhoResumo
2. Introdução aos modelos de linguagem de grande dimensão para a geração de texto
O que são modelos de geração de texto?Representações vetoriais: A Essência Numérica da LinguagemArquitetura de Transformação: Orquestração de relações contextuaisGeração de texto probabilístico: O mecanismo de decisãoFundamentos históricos: A ascensão das arquitecturas de transformadorTransformadores pré-treinados generativos da OpenAIGPT-3.5-turbo e ChatGPTGPT-4Gemini da GoogleA Lhama da Meta e o código abertoAproveitamento da quantização e do LoRAMistralAntropica: ClaudeGPT-4V(isão)Comparação de modelosResumo
3. Práticas padrão para a geração de texto com o ChatGPT
Geração de listasGeração de listas hierárquicasQuando evitar a utilização de expressões regularesGerar JSONYAMLFiltragem de cargas YAMLManipulação de cargas inválidas em YAMLGeração de formatos diversificados com o ChatGPTSimulação de dados CSVExplica como se eu tivesse cinco anosTradução universal através dos LLMsPergunta pelo contextoSeparação de estilos de textoIdentificar as caraterísticas textuais desejadasGeração de novos conteúdos com as caraterísticas extraídasExtração de caraterísticas textuais específicas com LLMsSumarizaçãoResumir as limitações de uma janela de contextoSeparação de textoVantagens de dividir o texto em partesCenários para fragmentar o textoExemplo de fragmentação deficienteEstratégias de fragmentaçãoDeteção de frases utilizando o SpaCyConstrói um Algoritmo de Chunking Simples em PythonJanelas de correr com trincosPacotes de fragmentação de textoSeparação de texto com TiktokenCodificaçõesEntendendo a Tokenização de StringsEstimativa do uso de token para chamadas à API de chatAnálise de sentimentosTécnicas para melhorar a análise de sentimentosLimitações e desafios da análise de sentimentosDo menos ao maisPlanear a arquiteturaCodificação de funções individuaisAdicionar testesVantagens da técnica do mínimo ao máximoDesafios com a técnica do menos ao maisPrompting de funçõesBenefícios do Role PromptingDesafios do Role PromptingQuando utilizar o prompt de funçãoTácticas de prompt do GPTEvitar alucinações com referênciaDá aos GPTs "tempo para pensar"A tática do monólogo interiorRespostas de autoavaliação do LLMClassificação com LLMsCriar um modelo de classificaçãoVoto por maioria para a classificaçãoAvaliação dos critériosMeta PromptingResumo
4. Técnicas avançadas de geração de texto com LangChain
Introdução à LangChainConfiguração do ambienteModelos de chatModelos de chat em fluxo contínuoCriar várias gerações de LLMModelos de prompt LangChainLinguagem de Expressão LangChain (LCEL)Usando PromptTemplate com modelos de chatAnalisadores de saídaAvaliações LangChainChamada de funções OpenAIChamada de função paralelaChamada de funções em LangChainExtrair dados com LangChainPlaneamento de consultasCriar modelos de prompt de poucas fotosExemplos de poucos disparos de comprimento fixoFormatar os exemplosSeleção de exemplos de poucos disparos por comprimentoLimitações com exemplos de poucos disparosGuardar e carregar prompts LLMLigação de dadosCarregadores de documentosSeparadores de textoDivisão de texto por comprimento e tamanho de tokenDivisão de texto com divisão recursiva de caracteresDecomposição de tarefasEncadeamento promptCadeia sequencialitemgetter e extração de chave de dicionárioEstruturação das cadeias LCELCadeias de documentosCoisasRefinarRedução de mapasRe-ranquear mapaResumo
5. Bases de dados vetoriais com FAISS e Pinecone
Geração Aumentada de Recuperação (RAG)Apresentando EmbeddingsCarregamento de documentosRecuperação de memória com FAISSRAG com LangChainBases de dados vetoriais alojadas com PineconeAuto-questionamentoMecanismos de recuperação alternativosResumo
6. Agentes autónomos com memória e ferramentas
Cadeia de pensamentoAgentesReage e age (ReAct)Aplicação do Raciocínio e do AtoUtilizar ferramentasUtilizar LLMs como uma API (Funções OpenAI)Comparação entre as funções OpenAI e ReactCasos de utilização das funções OpenAIReActCasos de utilização do ReactFerramentas para agentesPersonalização de agentes standardAgentes aduaneiros em LCELCompreender e utilizar a memóriaMemória a longo prazoMemória de curto prazoMemória de curto prazo em agentes de conversação de GQMemória em LangChainPreservar o EstadoConsultar o EstadoConversationBufferMemoryOutros tipos de memória populares em LangChainConversationBufferWindowMemoryConversationSummaryMemory (Memória do resumo da conversa)ConversationSummaryBufferMemoryConversationTokenBufferMemoryFunções do OpenAI Agente com memóriaEstruturas avançadas de agentesAgentes de planeamento e execuçãoÁrvore dos PensamentosChamadas de retornoCallbacks globais (Construtor)Callbacks específicos do pedidoO argumento verbosoQuando utilizar o Which?Contagem de tokens com LangChainResumo
7. Introdução aos modelos de difusão para geração de imagens
OpenAI DALL-EA meio da viagemDifusão estávelGoogle GeminiTexto para vídeoComparação de modelosResumo
8. Práticas normalizadas para a criação de imagens com o Midjourney
Modificadores de formatoModificadores de estilo artísticoPrompts de Engenharia InversaReforços de qualidadePrompts negativosTermos ponderadosPrompting com uma imagemPintarPintura exteriorPersonagens consistentesReescreve o promptSeparação de memesMapeamento de MemeAnálise do promptResumo
9. Técnicas avançadas de geração de imagens com difusão estável
Executa a difusão estávelInterface de utilizador Web AUTOMATIC1111Img2ImgAumentar a escala de imagensInterroga o CLIPSD Inpainting e OutpaintingControlNetModelo de qualquer segmento (SAM)Afinação do DreamBoothRefinador XL de difusão estávelResumo

10. Criar aplicações com IA
Escrever um blogue sobre IAPesquisa sobre o temaEntrevista com o especialistaGerar esboçoGeração de textoEstilo de escritaOtimização do títuloImagens do blogue da IAInterface do utilizadorResumo
Índice
Sobre os autores

Content preview from Engenharia prompt para IA generativa

Capítulo 5. Bases de dados vetoriais com FAISS e Pinecone

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Este capítulo introduz o conceito de embeddings e bases de dados de vectores, discutindo como podem ser utilizados para fornecer contexto relevante nos prompts.

Uma base de dados de vectores é uma ferramenta mais frequentemente utilizada para armazenar dados de texto de forma a permitir a consulta com base na semelhança ou no significado semântico. Esta tecnologia é utilizada para diminuir as alucinações (em que o modelo de IA inventa algo), referenciando dados com os quais o modelo não foi treinado, melhorando significativamente a precisão e a qualidade da resposta do LLM. Os casos de utilização de bases de dados vetoriais também incluem a leitura de documentos, a recomendação de produtos semelhantes ou a recordação de conversas anteriores.

Os vectores são listas de números que representam texto (ou imagens), que podes pensar como coordenadas para uma localização. O vetor para a palavra mouse usando o modelo text-embedding-ada-002 do OpenAI é uma lista de 1.536 números, cada um representando o valor de uma caraterística que o modelo de incorporação aprendeu no treinamento:

[-0.011904156766831875,
 -0.0323905423283577,
 0.001950666424818337,
...]

Quando estes modelos são treinados, os textos que aparecem juntos nos dados de treino serão aproximados em valores, e os textos que não estão relacionados serão ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341637245

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Engenharia prompt para IA generativa

by James Phoenix, Mike Taylor

Capítulo 5. Bases de dados vetoriais com FAISS e Pinecone

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.