book

Diseño de aplicaciones de modelos de lenguaje grandes

by Suhas Pai

March 2025

Intermediate to advanced

366 pages

10h 39m

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

A quién va dirigido este libroCómo está estructurado este libroDe qué no trata este libroCómo leer el libroConvenciones utilizadas en este libroUtilizar ejemplos de códigoAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
Definición de los LLMsBreve historia de los LLMsPrimeros añosLa era moderna del LLMEl impacto de los LLMsUso del LLM en la EmpresaPromptingPrompting de disparo ceroPrompting de pocos disparosPrompting de la cadena de pensamientoEncadenamiento de promptPrompting adversarialAcceder a los LLMs a través de una APIPuntos fuertes y limitaciones de los LLMsConstruir tu primer prototipo de ChatbotDel prototipo a la producciónResumen
Ingredientes de un LLMRequisitos de los datos previos al entrenamientoConjuntos de datos de preentrenamiento popularesDatos sintéticos de preentrenamientoPreprocesamiento de los datos de entrenamientoFiltrado y limpieza de datosSeleccionar documentos de calidadDeduplicaciónEliminar información de identificación personalConjunto de entrenamiento DescontaminaciónMezclas de datosEfecto de los datos de preentrenamiento en las tareas posterioresCuestiones de sesgo e imparcialidad en los conjuntos de datos de preentrenamientoResumen
VocabularioTokenizadoresProceso de tokenizaciónNormalizaciónPre-TokenizaciónTokenizaciónCodificación de pares de bytesWordPieceFichas especialesResumen
PreliminaresRepresentar el significadoLa arquitectura del transformadorAutoatenciónCodificación posicionalRedes alimentadasNormalización de capasFunciones de pérdidaEvaluación intrínseca del modeloTransformadoresArquitecturas sólo codificadorArquitecturas codificador-decodificadorArquitecturas de sólo descodificadorMezcla de expertosObjetivos de aprendizajeModelado lingüístico completoModelado lingüístico de prefijosModelado del lenguaje enmascarado¿Qué objetivos de aprendizaje son mejores?Modelos de preentrenamientoResumen
Navegar por el panorama del LLM¿Quiénes son los proveedores del LLM?Modelos de saboresLLMs de código abiertoCómo elegir un LLM para tu tareaLLMs de código abierto frente a LLMs propietariosEvaluación del LLMCargando LLMsCara de abrazo AcelerarOllamaAPI de inferencia LLMEstrategias de descodificaciónDescodificación codiciosaBúsqueda por hazMuestreo Top-kMuestreo Top-pEjecutar la inferencia en LLMsSalidas estructuradasDepuración de modelos e interpretabilidadResumen
La necesidad de afinarAjuste fino: Un ejemplo completoParámetros de los algoritmos de aprendizajeParámetros de optimización de la memoriaParámetros de regularizaciónTamaño del loteAjuste fino eficaz de los parámetrosTrabajar con precisión reducidaPonerlo todo juntoAfinar los conjuntos de datosUtilización de conjuntos de datos de ajuste de instrucciones disponibles públicamenteConjuntos de datos de ajuste de instrucciones generados por el LLMResumen
Formación previa continuaRepetición (Memoria)Ampliación de parámetrosAjuste fino eficaz de los parámetrosAñadir nuevos parámetrosMétodos de subconjuntoCombinar varios modelosEnsamblaje de modelosModelo FusiónFusión de adaptadoresResumen

Definir la formación en alineaciónAprendizaje por RefuerzoTipos de retroalimentación humanaEjemplo de RLHFAlucinacionesMitigar las alucinacionesAutoconsistenciaCadena de accionesRecitadoMétodos de muestreo para abordar la alucinaciónDescodificación por capas contrastadasAlucinaciones en contextoAlucinaciones debidas a información irrelevanteRazonamientoRazonamiento deductivoRazonamiento inductivoRazonamiento AbductivoRazonamiento de sentido comúnInducir el razonamiento en los LLMsVerificadores para mejorar el razonamientoCálculo en tiempo de inferenciaAfinar el razonamientoResumen
Retos de la inferencia LLMTécnicas de optimización de la inferenciaTécnicas para reducir el cálculoCaché K-VSalida anticipadaDestilación del conocimientoTécnicas para acelerar la descodificaciónDescodificación especulativaDescodificación paralelaTécnicas para reducir las necesidades de almacenamientoCuantización simétricaCuantización asimétricaResumen
LLM Paradigmas de interacciónEnfoque pasivoEl enfoque explícitoEl enfoque autónomoDefinición de los agentesFlujo de trabajo agenéticoComponentes de un sistema agenéticoModelosHerramientasAlmacenes de datosprompt de bucle de agenteBarandillas y verificadoresSoftware de orquestación de agentesResumen
Introducción a las IncrustacionesBúsqueda semánticaMedidas de similitudAjuste de los modelos de incrustaciónModelos baseConjunto de datos de entrenamientoFunciones de pérdidaIncrustación de instruccionesOptimizar el tamaño de la incrustaciónIncrustaciones MatrioskasIncrustaciones binarias y enterasCuantización del productoAgruparDespiece de Ventanas CorrederasAgrupación de metadatosAgrupamiento según el diseñoAgrupamiento semánticoChunking tardíoBases de datos vectorialesInterpretar incrustacionesResumen
La necesidad del GAREscenarios RAG típicosDecidir cuándo recuperarLa tubería RAGReescribeRecuperarRerankPerfeccionaInsertaGeneraRAG para la gestión de la memoriaDAR para seleccionar ejemplos de formación en contextoRAG para Formación de ModelosLimitaciones de los GARRAG Versus Contexto LargoRAG Versus Ajuste FinoResumen
Arquitecturas Multi-LLMLLM CascadasEnrutadoresLLMs Especializados en TareasParadigmas de programaciónDSPyLMQLResumen

Content preview from Diseño de aplicaciones de modelos de lenguaje grandes

Capítulo 4. Arquitecturas y objetivos de aprendizaje

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los Capítulos 2 y3, hemos tratado algunos de los ingredientes clave que intervienen en la creación de un modelo lingüístico: los conjuntos de datos de entrenamiento, y el vocabulario y el tokenizador. A continuación, vamos a completar el puzzle conociendo los propios modelos, las arquitecturas que los sustentan y sus objetivos de aprendizaje.

En este capítulo, aprenderemos la composición de los modelos de lenguaje y su estructura. Los modelos de lenguaje actuales se basan predominantemente en la arquitectura Transformer, por lo que dedicaremos la mayor parte de nuestra atención a comprenderla, repasando en detalle cada componente de la arquitectura. En los últimos años se han propuesto diversas variantes y alternativas a la arquitectura Transformer original. Repasaremos las más prometedoras, incluidos los modelos de Mezcla de Expertos (MoE). También examinaremos los objetivos de aprendizaje más comunes sobre los que se entrenan los modelos lingüísticos, incluida la predicción del siguiente token. Por último, pondremos en práctica los conceptos de los tres últimos capítulos aprendiendo a preentrenar un modelo lingüístico desde cero.

Preliminares

Casi todos los modelos lingüísticos contemporáneos se basan en redes neuronales, compuestas por unidades de procesamiento llamadas neuronas. Aunque las redes neuronales ...