Capítulo 5. Bases de datos vectoriales con FAISS y Pinecone

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Este capítulo introduce el concepto de incrustaciones y bases de datos vectoriales, y analiza cómo pueden utilizarse para proporcionar un contexto relevante en las indicaciones.

Una base de datos vectorial es una herramienta que se suele utilizar en para almacenar datos de texto de forma que permita realizar consultas basadas en la similitud o el significado semántico. Esta tecnología se utiliza para disminuir las alucinaciones (cuando el modelo de IA se inventa algo) haciendo referencia a datos en los que el modelo no está entrenado, lo que mejora significativamente la precisión y la calidad de la respuesta del LLM. Los casos de uso de las bases de datos vectoriales también incluyen la lectura de documentos, la recomendación de productos similares o el recuerdo de conversaciones pasadas.

Los vectores son listas de números que representan texto (o imágenes), en las que podrías pensar como coordenadas de una ubicación. El vector de la palabra ratón utilizando el modelo de incrustación de texto-ada-002 de OpenAI es una lista de 1.536 números, cada uno de los cuales representa el valor de una característica que el modelo de incrustación aprendió en el entrenamiento:

[-0.011904156766831875,
 -0.0323905423283577,
 0.001950666424818337,
...]

Cuando se entrenen estos modelos, los textos que aparezcan juntos en los ...

Get Ingeniería Prompt para la IA Generativa now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.