book

Aprende a usar a LangChain

by Mayo Oshin, Nuno Campos

March 2025

Intermediate to advanced

296 pages

6h 58m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Breve resumo dos LLMsLLMs ajustados por instruçãoLLMs ajustados ao diálogoLLMs ajustadosBreve introdução ao promptPrompting de disparo zeroCadeia de pensamentoGeração aumentada por recuperaçãoChamada de ferramentaPrompting de poucos disparosLangChain e porque é importanteO que podes esperar deste livroConvenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos
Como configurar o LangChainUtilizar LLMs na LangChainTornar reutilizáveis os prompts do LLMObtém formatos específicos dos LLMsSaída JSONOutros formatos legíveis por máquina com analisadores de saídaJunta as várias peças de uma candidatura a LLMUsando a interface executávelComposição imperativaComposição DeclarativaResumo
O objetivo: Escolher um contexto relevante para LLMsIncorporações: Conversão de texto em númerosIntegrações antes de LLMsEmbeddings baseados em LLMExplica a incorporação semânticaConverter os teus documentos em textoDividir o teu texto em partesGerar texto incorporadoArmazenamento de embeddings num vetorComo configurar o PGVectorTrabalhar com lojas de vectoresAcompanhamento de alterações nos teus documentosOtimização da indexaçãoMultiVectorRetrieverRAPTOR: Processamento Recursivo Abstrativo para Recuperação Organizada por ÁrvoresColBERT: Otimização de incrustaçõesResumo
Apresentando a Geração Aumentada por RecuperaçãoRecuperação de documentos relevantesGerar previsões LLM usando documentos relevantesTransformação de consultasReescrever-Recuperar-LerRecuperação de várias consultasRAG-FusãoEmbeddings de documentos hipotéticosEncaminhamento de consultasRoteamento lógicoRoteamento semânticoConstrução de consultasFiltro de texto para metadadosTexto para SQLResumo
Criar um sistema de memória de chatbotApresentando o LangGraphCriar um StateGraphAdicionando memória ao StateGraphModificar o histórico do chatRecortar mensagensFiltrar mensagensFundir mensagens consecutivasResumo
Arquitetura #1: Chamada LLMArquitetura #2: CadeiaArquitetura #3: RouterResumo
O ciclo Planear-FazerCriar um agente LangGraphLiga sempre primeiro para uma ferramentaLidar com muitas ferramentasResumo
ReflexãoSubgrafos em LangGraphChamada direta de um subgrafoChamando um subgrafo com uma funçãoArquitecturas Multi-AgentesSupervisor de arquiteturaResumo
Saída estruturadaProdução intermédiaTransmissão de saída LLM Token-by-TokenModalidades Human-in-the-LoopLLMs multitarefaResumo
Pré-requisitosInstalar dependênciasModelo de língua grandeLoja de vectoresAPI de backendCria uma conta LangSmithCompreender a API da plataforma LangGraphModelos de dadosCaraterísticasImplementar a tua aplicação de IA na plataforma LangGraphCria uma configuração da API LangGraphTesta a tua aplicação LangGraph localmenteImplanta a partir da interface do usuário do LangSmithLança o LangGraph StudioSegurançaResumo

Técnicas de teste ao longo do ciclo de desenvolvimento de aplicações LLMA fase de conceção: RAG autocorretivoA fase de pré-produçãoCriar conjuntos de dadosDefinir os teus critérios de avaliaçãoTeste de regressãoAvaliação do desempenho de um agente de ponta a pontaProduçãoRastreioRecolhe feedback na produçãoClassificação e etiquetagemMonitorização e correção de errosResumo
Chatbots interactivosEdição colaborativa com LLMsComputação ambienteResumo

Content preview from Aprende a usar a LangChain

Capítulo 3. RAG Parte II: Conversar com os teus dados

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

No capítulo anterior, aprendeste a processar os dados e a criar e armazenar embeddings num vetor de armazenamento. Neste capítulo, aprenderás a recuperar eficientemente os embeddings e pedaços de documentos mais relevantes com base na consulta de um utilizador. Isto permite-te construir um prompt que contém documentos relevantes como contexto, melhorando a precisão do resultado final do LLM.

Este processo - que envolve a incorporação de uma consulta do utilizador, a recuperação de documentos semelhantes a partir de uma fonte de dados e a sua transmissão como contexto para o prompt enviado para o LLM - é formalmente conhecido como retrieval-augmented generation (RAG).

O RAG é um componente essencial da construção de aplicações LLM com chat que são precisas, eficientes e actualizadas. Neste capítulo, vais passar do básico às estratégias avançadas para construir um sistema RAG eficaz para várias fontes de dados (como armazenamentos vetoriais e bases de dados) e estruturas de dados (estruturadas e não estruturadas).

Mas primeiro, vamos definir o RAG e discutir as suas vantagens.

Apresentando a Geração Aumentada por Recuperação

RAG é uma técnica utilizada para melhorar a precisão dos resultados gerados pelos LLMs, fornecendo contexto de fontes externas. O termo foi originalmente cunhado num artigo de pesquisadores ...