book

El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

Name: El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño
Author: Steve Wilson
ISBN: 9798341629509

by Steve Wilson

March 2025

Intermediate to advanced

200 pages

6h 27m

Spanish

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefacio
Quién debería leer este libroPor qué escribí este libroNavegar por este libroSección 1: Sentar las bases (Capítulos 1-3)Sección 2: Riesgos, vulnerabilidades y soluciones (Capítulos 4-9)Sección 3: Crear un proceso de seguridad y prepararse para el futuro (Capítulos 10-12)Convenciones utilizadas en este libroAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
1. Chatbots Breaking Bad
Hablemos de TayEl rápido declive de Tay¿Por qué rompió Tay?Es un problema difícil
2. El Top 10 de OWASP para aplicaciones LLM
Acerca de OWASPLos 10 mejores para el Proyecto de Solicitud de LLMEjecución del proyectoRecepciónClaves del éxitoEste libro y la lista de los 10 mejores
3. Arquitecturas y límites de confianza
IA, redes neuronales y grandes modelos lingüísticos: ¿Cuál es la diferencia? La Revolución Transformadora: Orígenes, impacto y la conexión con el LLMOrígenes del TransformerImpacto de la arquitectura de los transformadores en la IATipos de aplicaciones basadas en el LLMArquitectura de la aplicación LLMLímites de confianzaEl modeloInteracción con el usuarioDatos de entrenamientoAcceso a Fuentes de Datos Externas ActivasAcceso a los servicios internosConclusión
4. Inyección prompt
Ejemplos de ataques de inyección promptSugerencia contundentePsicología inversaDespistePrompting Adversarial Universal y AutomatizadoLos efectos de la inyección promptInyección prompt directa frente a indirectaInyección directa promptInyección prompt indirectaDiferencias claveMitigación de la inyección promptLimitación de velocidadFiltrado de entrada basado en reglasFiltrar con un LLM de propósito especialAñadir estructura de promptFormación AdversarialDefinición pesimista del límite de confianzaConclusión
5. ¿Puede tu LLM saber demasiado?
Ejemplos realesLee LudaGitHub Copilot y el Códice de OpenAIMétodos de adquisición de conocimientosModelo de formaciónFormación en el modelo básicoConsideraciones de seguridad para los modelos de cimentaciónAjuste del modeloRiesgos de la formaciónRecuperación-Generación mejoradaAcceso directo a la WebAcceder a una base de datosAprender de la interacción con el usuarioConclusión
6. ¿Sueñan los modelos lingüísticos con ovejas eléctricas?
¿Por qué alucinan los LLMs?Tipos de alucinacionesEjemplosPrecedentes jurídicos imaginariosDemanda contra un chatbot de aerolíneaAsesinato involuntario del personajeAlucinaciones sobre paquetes de código abierto¿Quién es responsable?Buenas prácticas de mitigaciónAmpliación de los conocimientos específicos de dominioPrompting de cadena de pensamiento para aumentar la precisiónCircuitos de retroalimentación: El poder de las aportaciones de los usuarios para mitigar los riesgosComunicación clara del uso previsto y las limitacionesEducación del Usuario: Capacitar a los usuarios mediante el conocimientoConclusión
7. No confíes en nadie
Descifrar la Confianza Cero¿Por qué ser tan paranoico?Implantar una Arquitectura de Confianza Cero para tu LLMVigila la Agencia ExcesivaAsegurar la manipulación de tus salidasConstruir tu filtro de salidaBuscar PII con RegexEvaluación de la toxicidadVincular tus filtros a tu LLMDesinfecta para mayor seguridadConclusión
8. No pierdas la cartera
Ataques DoSAtaques basados en el volumenAtaques de protocoloAtaques a la capa de aplicaciónUn ataque DoS épico: DynModelo de ataques DoS dirigidos a LLMsAtaques por escasez de recursosAgotamiento de las Ventanas de ContextoEntrada impredecible del usuarioAtaques DoWClonación de modelosEstrategias de mitigaciónBarreras de seguridad específicas del dominioValidación y Saneamiento de EntradasLimitación de velocidad robustaLimitación del uso de recursosMonitoreo y alertasUmbrales financieros y alertasConclusión
9. Encuentra el eslabón más débil
Aspectos básicos de la cadena de suministroSeguridad de la cadena de suministro de softwareLa filtración de Equifax El hack de SolarWinds La vulnerabilidad de Log4Shell Comprender la cadena de suministro del LLMRiesgo del modelo de código abiertoEnvenenamiento de datos de entrenamientoDatos de entrenamiento accidentalmente inseguroPlug-ins insegurosCrear artefactos para rastrear tu cadena de suministroImportancia de los SBOMTarjetas modeloTarjetas modelo frente a SBOMCycloneDX: La norma SBOMEl auge del ML-BOMConstruir una ML-BOM de muestraEl Futuro del LLM Seguridad en la Cadena de SuministroFirma digital y marca de aguaClasificaciones y bases de datos de vulnerabilidadesConclusión

10. Aprender de la historia futura
Revisión del Top 10 de OWASP para aplicaciones LLMCasos prácticosEl Día de la Independencia: Un celebrado desastre de seguridad2001: Una odisea del espacio de fallos de seguridadConclusión
11. Confía en el proceso
La evolución de DevSecOpsMLOpsLLMOpsIntegrar la seguridad en los LLMOps La seguridad en el proceso de desarrollo del LLMAsegurar tu CI/CDHerramientas de pruebas de seguridad específicas del LLMGestionar tu cadena de suministroProtege tu aplicación con GuardrailsEl papel de las barandillas en una estrategia de seguridad LLMSoluciones de barandillas de código abierto frente a las comercialesMezclar barandillas personalizadas y empaquetadasMonitorea tu aplicaciónRegistrar cada prompt y respuestaGestión centralizada de registros y eventosAnálisis del comportamiento de usuarios y entidadesCrea tu equipo rojo de IAVentajas del Red Teaming de IAEquipos rojos frente a Pen TestsHerramientas y enfoquesMejora continuaEstablecer y ajustar los guardarraílesGestionar el acceso a los datos y su calidadAprovechar el RLHF para la alineación y la seguridadConclusión
12. Un marco práctico para la seguridad responsable de la IA
PotenciaGPUsNubeCódigo abiertoMultimodalAgentes autónomosResponsabilidadEl marco RAISELista de control RAISEConclusión
Índice
Sobre el autor

Content preview from El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

Capítulo 7. No confíes en nadie

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Antes de la reciente obsesión por la serie de Netflix Stranger Things, en los años 90 estaba Expediente X, unade mis series favoritas de todos los tiempos. Trataba de dos agentes del FBI que investigaban fenómenos extraños como monstruos, alienígenas y conspiraciones gubernamentales. El protagonista de la serie, Fox Mulder, tenía dos eslóganes. Una de esas frases era esperanzadora La verdad está ahí fuera. La otra era profundamente paranoica No confíes en nadie.

En este capítulo, nos centraremos en la segunda frase. Repasaremos brevemente los innumerables riesgos inherentes a las arquitecturas típicas de LLM y señalaremos que, aunque merece la pena aplicar las mitigaciones comentadas anteriormente, no hay forma de asumir que la salida de tu modelo sea siempre digna de confianza. Adoptaremos el mantra de Mulder "No confíes en nadie" y exploraremos cómo puedes aplicar un enfoque de confianza cero a tu aplicación LLM. ¡La paranoia no es locura cuando la amenaza es real!

Confianza cero no es sólo una palabra de moda; es un marco riguroso diseñado para asumir que las amenazas pueden venir de cualquier parte, incluso dentro de tus sistemas de confianza. Este modelo es beneficioso para los LLMs, que a menudo ingieren una variedad de entradas de fuentes poco fiables. Examinaremos cómo puedes gestionar la "agencia" que tiene tu LLM, limitando ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Creación de sistemas de análisis en tiempo real

Publisher Resources

ISBN: 9798341629509

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

by Steve Wilson

Capítulo 7. No confíes en nadie

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.