Skip to Content
Engenharia prompt para IA generativa
book

Engenharia prompt para IA generativa

by James Phoenix, Mike Taylor
March 2025
Intermediate to advanced
422 pages
10h 54m
Portuguese (Portugal, Brazil)
O'Reilly Media, Inc.
Audio summary available
Content preview from Engenharia prompt para IA generativa

Capítulo 5. Bases de dados vetoriais com FAISS e Pinecone

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Este capítulo introduz o conceito de embeddings e bases de dados de vectores, discutindo como podem ser utilizados para fornecer contexto relevante nos prompts.

Uma base de dados de vectores é uma ferramenta mais frequentemente utilizada para armazenar dados de texto de forma a permitir a consulta com base na semelhança ou no significado semântico. Esta tecnologia é utilizada para diminuir as alucinações (em que o modelo de IA inventa algo), referenciando dados com os quais o modelo não foi treinado, melhorando significativamente a precisão e a qualidade da resposta do LLM. Os casos de utilização de bases de dados vetoriais também incluem a leitura de documentos, a recomendação de produtos semelhantes ou a recordação de conversas anteriores.

Os vectores são listas de números que representam texto (ou imagens), que podes pensar como coordenadas para uma localização. O vetor para a palavra mouse usando o modelo text-embedding-ada-002 do OpenAI é uma lista de 1.536 números, cada um representando o valor de uma caraterística que o modelo de incorporação aprendeu no treinamento:

[-0.011904156766831875,
 -0.0323905423283577,
 0.001950666424818337,
...]

Quando estes modelos são treinados, os textos que aparecem juntos nos dados de treino serão aproximados em valores, e os textos que não estão relacionados serão ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Programação assistida por IA

Programação assistida por IA

Tom Taulli
Aprende a usar a LangChain

Aprende a usar a LangChain

Mayo Oshin, Nuno Campos

Publisher Resources

ISBN: 9798341637245