book

Bases de datos vectoriales (Spanish Edition)

Name: Bases de datos vectoriales (Spanish Edition)
Author: Nitin Borwankar
ISBN: 0642572369798

by Nitin Borwankar

April 2026

Intermediate

292 pages

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

Prefacio
Qué hay en este libroA quién va dirigido este libroCómo usar este libroRequisitos de software, entorno y recursosConvenciones utilizadas en este libroUso de los ejemplos de códigoO’Reilly Online LearningCómo contactarnosAgradecimientos
1. Introducción a las bases de datos vectoriales
¿Por qué necesitas bases de datos vectoriales?Un nuevo tipo de datos: el vectorBúsqueda de similitudes¿Qué tiene de diferente el tipo vectorial?¿Dónde se usan las bases de datos vectoriales?SQL frente a las bases de datos vectorialesLos fundamentos de las matemáticas empresariales: aritmética contableRepresentación vectorial en un sistema de gestión de bases de datos relacionalesLa necesidad de capacidades específicas para vectoresNoSQL frente a las bases de datos vectorialesLas bases de datos NoSQL y el almacenamiento vectorialLimitaciones de las extensiones vectoriales en las bases de datos NoSQLCuándo elegir NoSQL con extensiones vectorialesEnfoques híbridos: combinación de datos estructurados y vectorialesLa necesidad tanto de datos vectoriales como de metadatosLimitaciones del almacenamiento vectorial puroArquitectura de base de datos híbridaEjemplo de una consulta híbridaVentajas del enfoque híbridoConclusión
2. Incrustaciones
Entender las incrustaciones vectoriales: por qué las necesitamosWord2Vec: el avance que lo cambió todoDoc2Vec: de las palabras a los documentosDe las incrustaciones a los modelos de lenguaje modernos: la conexión con TransformerTransformadores solo con codificador (BERT y sus variantes)Transformadores solo decodificadores (familia GPT)Transformadores con codificador y decodificador (T5, BART)Modelos de incrustación: los generadores de vectores especializadosDiferencias con respecto a los modelos tradicionalesPapel en las aplicaciones modernas de LLMAplicaciones prácticas y casos de usoPipeline RAG simpleLa biblioteca Sentence-Transformers: la navaja suiza de las incrustaciones de textoBuenas prácticas para usar SentenceTransformers: una guía detalladaLa capa de incrustación: la puerta de entrada al aprendizaje sin entrenamiento previoAnatomía de las incrustaciones de TransformerConexión con el aprendizaje sin entrenamiento previoCaracterísticas clave que permiten el aprendizaje sin entrenamiento previoLimitaciones y consideracionesÚltimos avances y tendenciasAritmética vectorial con Word2Vec: una guía prácticaPaso 1: Configuración e instalaciónPaso 2: Carga del modelo Word2Vec preentrenadoPaso 3: Implementar funciones aritméticas vectorialesPaso 4: Analogía clásica entre el rey y la reinaPaso 5: Más analogías interesantesPaso 6: Herramienta de exploración interactivaConclusiones sobre la aritmética vectorialConclusión
3. Búsqueda por similitud con FAISS
FundamentosRepresentaciones vectorialesMétricas de distanciaHeurísticas de selecciónÍndices FAISSÍndices planos (fuerza bruta)Índices basados en IVFÍndices basados en LSHÍndices basados en HNSWOtros índices especializadosÍndices compuestos y transformativosCómo elegir el índice adecuadoCuantificaciónSQPQEl problema de las redes neuronales artificialesEl problemaEvitar el costo computacionalTécnicas clave de ANN en FAISSElegir un índice en FAISSEjemplo de códigoComprender los índices HNSW¿Qué es HNSW?Cómo funciona HNSWExplicación de los parámetros claveEjemplo práctico: Creación de un sistema de búsqueda por similitudCaracterísticas de rendimientoBuenas prácticasArquitectura y componentes de FAISSFundamentosConceptos básicosComponentes claveFlujo de trabajo habitualEjemplo ilustrativoPuntos claveMás informaciónConclusión
4. Búsqueda semántica con SQLite3
Comprender la extensión de búsqueda de similitud vectorial de SQLiteCapacidades principalesDescripción general de la arquitecturaLimitacionesConfiguración del entorno de desarrolloInstalación de dependenciasVerificación de la instalaciónPragmas operativasDiseño del esquema de la base de datosRequisitos del esquemaDefiniciones de tablasDecisiones de diseño del esquemaConectarse a Reddit con el envoltorio de la API de Reddit para PythonCreación de credenciales de la API de RedditImplementación del cliente PRAWEjemplo de usoExtracción y preprocesamiento de contenidoProceso de limpieza de textoFiltrado de calidadGeneración y almacenamiento de incrustacionesGenerador de incrustacionesAlmacenamiento en base de datosProceso de procesamiento por lotesCreación del índice vectorialComprender la indexación VSSGestión de índicesImplementación de la búsqueda semánticaContenedor de resultados de búsquedaMotor de búsquedaPoniendo todo juntoEjemplo de flujo de trabajoEjemplo de salidaExtensión: indexación incrementalConclusión
5. Creación de un sistema de búsqueda de artículos de ArXiv con PostgreSQL pgvector
El reto de buscar en la literatura científicaPor qué ArXiv es una fuente de datos idealCasos de uso en el mundo realJustificación de la pila tecnológicaDescripción general de la arquitecturaComponentes del sistemaFlujo de datosFilosofía de diseñoConfiguración del entorno y dependenciasInstalación de PostgreSQL y pgvectorConfiguración del entorno PythonEstructura y configuración de directoriosVerificación y pruebasDiseño de la base de datos para artículos científicosPrincipios de diseño del esquemaEstructura de las tablas principalesEstrategia de almacenamiento vectorialEstrategia de indexaciónIntegración con ArXiv y gestión de PDFImplementación del cliente de la API de ArXivProceso de descarga de PDFSistema de procesamiento por lotesExtracción y procesamiento de texto de PDFDesafíos de la extracción de PDFSegmentación inteligente de textoGeneración y almacenamiento de incrustacionesEstrategia del modelo de incrustaciónFlujo de trabajo de procesamiento por lotesImplementación de la búsqueda por similitudAplicación interactiva e interfaz de usuarioPaquetes Docker para implementación localArquitectura de contenedoresConfiguración de Docker ComposeScripts de inicialización de la base de datosFlujo de trabajo de desarrolloDiseño listo para la nubeAjuste básico del rendimientoConfiguración de índicesRendimiento de las consultasGestión de recursosPróximos pasosLimitaciones actualesIdeas de mejoraLo que hicimosLogros del sistemaHabilidades técnicas adquiridasHerramienta de investigación prácticaBase para sistemas avanzadosPotencial futuroConclusión
6. Creación de un sistema de generación aumentada por recuperación con SQLite VSS y Ollama
Descripción general de la arquitectura del sistemaBase de datos con soporte vectorialConfiguración de la base de datos habilitada para vectoresDiseño de esquemas para RAGCreación de índices de búsquedaProcesamiento de texto y generación de incrustacionesIncorporación de la gestión de modelosFragmentación inteligente de textoAlmacenamiento de contenido con incrustacionesImplementación de búsqueda híbridaAlgoritmo de búsqueda híbridaComponente de búsqueda semánticaComponente de búsqueda por palabras claveFusión de puntuaciones y clasificaciónIntegración de LLM con OllamaCliente de la API de OllamaFunción de comprobación de estadoEl proceso RAGFormateo de contextoProceso de preguntas y respuestasDemostración y pruebasCarga de datos de muestraFunción de demostración principalInterfaz interactiva de preguntas y respuestasUtilidad de pruebas rápidasPróximos pasos: ampliación del sistemaCaracterísticas de los datos de Reddit que faltanOptimizaciones de rendimientoConsideraciones de producciónPatrones RAG avanzadosConclusión
7. Creación de un sistema RAG científico con PostgreSQL y pgvector
Objetivos y capacidades del sistemaDescripción general de la arquitecturaBase de datos con pgvectorConfiguración y puesta en marcha de la base de datosDiseño de esquemas para artículos científicosÍndices vectoriales de alto rendimientoEstrategia de generación de incrustacionesIntegración con ArXiv y procesamiento de PDFBúsqueda de artículos con la API de ArXivExtracción inteligente de texto de PDFSegmentación avanzada de textoCanal de almacenamiento con incrustacionesBúsqueda semántica multinivelBúsqueda a nivel de resumenBúsqueda a nivel de secciónEl proceso RAG: análisis en profundidadIntegración de LLM local con OllamaComprobación de estado y descubrimiento de modelosRecuperación inteligente de contextoIngeniería de prompts científicosPipeline completo de ejecución RAGDemostración e interfaz interactivaFlujo de demostración principalDemostraciones de búsquedaDemostración de RAGInterfaz de búsqueda interactivaPunto de entrada con selección de modoNota técnica sobre HNSWCómo evaluar tus resultadosPróximos pasos: ampliación del sistema RAG científicoConclusión
8. Creación de un sistema completo de búsqueda conversacional y RAG
Objetivos y capacidades del sistemaDescripción general de la arquitectura del sistemaLo que construiremos juntosBase de datos para el almacenamiento de conversacionesDiseño del esquema de conversaciónArquitectura de tres tablas para un rendimiento óptimoIndexación vectorial de alto rendimientoImportación de conversaciones y proceso de datosImportación robusta de JSON con manejo de erroresProcesamiento de transacciones atómicasManejo de marcas de tiempo y validación de datosRecuperación de errores y registroGeneración eficiente de incrustaciones y procesamiento por lotesPatrón Singleton para la gestión de modelosEstrategia de procesamiento incrementalProcesamiento por lotes para un rendimiento óptimoInserción en la base de datos con manejo de conflictosBúsqueda contextual con comprensión conversacionalBúsqueda por similitud semánticaUniones de varias tablas para un contexto ricoFormato y estructura de los resultadosRecuperación del contexto de la conversaciónCálculo de la ventana de contexto de WindowsIntegración de RAG para el historial de conversacionesGestión de contexto estructuradoIntegración de LLM local con OllamaMonitoreo del estado y descubrimiento de modelosRecuperación y ensamblaje de contextoIngeniería de prompts conversacionalesPipeline RAG completo con monitoreo de rendimientoAPI web completa con FastAPIEstructura de la aplicación FastAPIModelos de solicitud con validaciónImplementación del punto final de búsquedaPunto final de preguntas y respuestas RAGEstadísticas y monitoreo del sistemaInicio y configuración del servidorDemostración y datos de muestraGeneración de datos de muestra realistasCobertura de muestras multitemáticasProceso de procesamiento de datos de muestraDemostración completa del sistemaDemostración progresiva de funcionesDemostración de RAG con ejecución condicionalFuncionalidad de importación de producciónPuntos de entrada de la aplicaciónConclusión: un sistema de conocimiento personal completo
9. Lenguaje de consulta vectorial
Conceptos básicosModelo de datosEstructura sintáctica básicaOperaciones vectorialesBúsqueda por similitudBúsqueda híbridaBúsqueda por rangoOperaciones por lotesFunciones vectoriales y agregacionesFunciones vectorialesAgregaciones vectoriales

Índice
Sobre el autor

Content preview from Bases de datos vectoriales (Spanish Edition)

Capítulo 6. Creación de un sistema de generación aumentada por recuperación con SQLite VSS y Ollama

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, nos enfocamos en los componentes individuales de la búsqueda vectorial: crear incrustaciones y realizar consultas de similitud. Ahora es el momento de juntar todas estas piezas para crear un sistema funcional de generación aumentada por recuperación (RAG).

A diferencia de las aplicaciones web a escala de producción que dependen de clústeres distribuidos en la nube, nuestro objetivo aquí es construir un sistema RAG de alto rendimiento, privado y totalmente local que se ejecute en una sola computadora de escritorio. Usaremos SQLite VSS para nuestro motor de búsqueda y Ollama como nuestro «cerebro» LLM local.

Los sistemas RAG resuelven una limitación fundamental de los LLMs: su conocimiento se congela en el momento del entrenamiento, lo que impide el acceso a información privada o reciente. Al complementar los LLMs con un mecanismo de recuperación, creamos un sistema que responde preguntas usando conocimiento actualizado y específico del dominio.

Nuestro objetivo es crear un sistema de preguntas y respuestas que responda de forma inteligente a consultas sobre el contenido de Reddit. Cuando un usuario haga una pregunta, el sistema (1) buscará entre las publicaciones almacenadas de Reddit para encontrar la información más relevante, (2) recuperará ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Privacidad y seguridad para modelos de lenguaje grandes (Spanish Edition)

Publisher Resources

ISBN: 0642572369798

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Bases de datos vectoriales (Spanish Edition)

by Nitin Borwankar

Capítulo 6. Creación de un sistema de generación aumentada por recuperación con SQLite VSS y Ollama

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.