book

El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

Name: El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño
Author: Steve Wilson
ISBN: 9798341629509

by Steve Wilson

March 2025

Intermediate to advanced

200 pages

6h 27m

Spanish

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefacio
Quién debería leer este libroPor qué escribí este libroNavegar por este libroSección 1: Sentar las bases (Capítulos 1-3)Sección 2: Riesgos, vulnerabilidades y soluciones (Capítulos 4-9)Sección 3: Crear un proceso de seguridad y prepararse para el futuro (Capítulos 10-12)Convenciones utilizadas en este libroAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
1. Chatbots Breaking Bad
Hablemos de TayEl rápido declive de Tay¿Por qué rompió Tay?Es un problema difícil
2. El Top 10 de OWASP para aplicaciones LLM
Acerca de OWASPLos 10 mejores para el Proyecto de Solicitud de LLMEjecución del proyectoRecepciónClaves del éxitoEste libro y la lista de los 10 mejores
3. Arquitecturas y límites de confianza
IA, redes neuronales y grandes modelos lingüísticos: ¿Cuál es la diferencia? La Revolución Transformadora: Orígenes, impacto y la conexión con el LLMOrígenes del TransformerImpacto de la arquitectura de los transformadores en la IATipos de aplicaciones basadas en el LLMArquitectura de la aplicación LLMLímites de confianzaEl modeloInteracción con el usuarioDatos de entrenamientoAcceso a Fuentes de Datos Externas ActivasAcceso a los servicios internosConclusión
4. Inyección prompt
Ejemplos de ataques de inyección promptSugerencia contundentePsicología inversaDespistePrompting Adversarial Universal y AutomatizadoLos efectos de la inyección promptInyección prompt directa frente a indirectaInyección directa promptInyección prompt indirectaDiferencias claveMitigación de la inyección promptLimitación de velocidadFiltrado de entrada basado en reglasFiltrar con un LLM de propósito especialAñadir estructura de promptFormación AdversarialDefinición pesimista del límite de confianzaConclusión
5. ¿Puede tu LLM saber demasiado?
Ejemplos realesLee LudaGitHub Copilot y el Códice de OpenAIMétodos de adquisición de conocimientosModelo de formaciónFormación en el modelo básicoConsideraciones de seguridad para los modelos de cimentaciónAjuste del modeloRiesgos de la formaciónRecuperación-Generación mejoradaAcceso directo a la WebAcceder a una base de datosAprender de la interacción con el usuarioConclusión
6. ¿Sueñan los modelos lingüísticos con ovejas eléctricas?
¿Por qué alucinan los LLMs?Tipos de alucinacionesEjemplosPrecedentes jurídicos imaginariosDemanda contra un chatbot de aerolíneaAsesinato involuntario del personajeAlucinaciones sobre paquetes de código abierto¿Quién es responsable?Buenas prácticas de mitigaciónAmpliación de los conocimientos específicos de dominioPrompting de cadena de pensamiento para aumentar la precisiónCircuitos de retroalimentación: El poder de las aportaciones de los usuarios para mitigar los riesgosComunicación clara del uso previsto y las limitacionesEducación del Usuario: Capacitar a los usuarios mediante el conocimientoConclusión
7. No confíes en nadie
Descifrar la Confianza Cero¿Por qué ser tan paranoico?Implantar una Arquitectura de Confianza Cero para tu LLMVigila la Agencia ExcesivaAsegurar la manipulación de tus salidasConstruir tu filtro de salidaBuscar PII con RegexEvaluación de la toxicidadVincular tus filtros a tu LLMDesinfecta para mayor seguridadConclusión
8. No pierdas la cartera
Ataques DoSAtaques basados en el volumenAtaques de protocoloAtaques a la capa de aplicaciónUn ataque DoS épico: DynModelo de ataques DoS dirigidos a LLMsAtaques por escasez de recursosAgotamiento de las Ventanas de ContextoEntrada impredecible del usuarioAtaques DoWClonación de modelosEstrategias de mitigaciónBarreras de seguridad específicas del dominioValidación y Saneamiento de EntradasLimitación de velocidad robustaLimitación del uso de recursosMonitoreo y alertasUmbrales financieros y alertasConclusión
9. Encuentra el eslabón más débil
Aspectos básicos de la cadena de suministroSeguridad de la cadena de suministro de softwareLa filtración de Equifax El hack de SolarWinds La vulnerabilidad de Log4Shell Comprender la cadena de suministro del LLMRiesgo del modelo de código abiertoEnvenenamiento de datos de entrenamientoDatos de entrenamiento accidentalmente inseguroPlug-ins insegurosCrear artefactos para rastrear tu cadena de suministroImportancia de los SBOMTarjetas modeloTarjetas modelo frente a SBOMCycloneDX: La norma SBOMEl auge del ML-BOMConstruir una ML-BOM de muestraEl Futuro del LLM Seguridad en la Cadena de SuministroFirma digital y marca de aguaClasificaciones y bases de datos de vulnerabilidadesConclusión

10. Aprender de la historia futura
Revisión del Top 10 de OWASP para aplicaciones LLMCasos prácticosEl Día de la Independencia: Un celebrado desastre de seguridad2001: Una odisea del espacio de fallos de seguridadConclusión
11. Confía en el proceso
La evolución de DevSecOpsMLOpsLLMOpsIntegrar la seguridad en los LLMOps La seguridad en el proceso de desarrollo del LLMAsegurar tu CI/CDHerramientas de pruebas de seguridad específicas del LLMGestionar tu cadena de suministroProtege tu aplicación con GuardrailsEl papel de las barandillas en una estrategia de seguridad LLMSoluciones de barandillas de código abierto frente a las comercialesMezclar barandillas personalizadas y empaquetadasMonitorea tu aplicaciónRegistrar cada prompt y respuestaGestión centralizada de registros y eventosAnálisis del comportamiento de usuarios y entidadesCrea tu equipo rojo de IAVentajas del Red Teaming de IAEquipos rojos frente a Pen TestsHerramientas y enfoquesMejora continuaEstablecer y ajustar los guardarraílesGestionar el acceso a los datos y su calidadAprovechar el RLHF para la alineación y la seguridadConclusión
12. Un marco práctico para la seguridad responsable de la IA
PotenciaGPUsNubeCódigo abiertoMultimodalAgentes autónomosResponsabilidadEl marco RAISELista de control RAISEConclusión
Índice
Sobre el autor

Content preview from El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

Capítulo 4. Inyección de prompt

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Enel Capítulo 1 se repasó la triste historia de cómo la vida de Tay quedó truncada tras el abuso de unos hackers vándalos. Ese estudio de caso fue el primer ejemplo destacado de lo que ahora llamamos inyección prompt, pero desde luego no es el último. Alguna forma de inyección prompt está implicada en la mayoría de las violaciones de seguridad relacionadas con el LLM que hemos visto en el mundo real.

En la inyección de prompt, un atacante crea entradas maliciosas para manipular la comprensión del lenguaje natural de un LLM. Esto puede hacer que el LLM actúe en contra de sus directrices operativas previstas. El concepto de inyección se ha incluido en casi todas las versiones de una lista OWASP Top 10 desde la lista original de 2001, por lo que merece la pena echar un vistazo a la definición genérica antes de profundizar.

Un ataque de inyección en seguridad de aplicaciones es un tipo de ciberataque en el que el atacante inserta instrucciones maliciosas en una aplicación vulnerable. El atacante puede entonces tomar el control de la aplicación, robar datos o interrumpir las operaciones. Por ejemplo, en un ataque de inyección SQL, un atacante introduce consultas SQL maliciosas en un formulario web, engañando al sistema para que ejecute comandos no deseados. Esto puede dar lugar a un acceso no autorizado o a la manipulación de la base ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Creación de sistemas de análisis en tiempo real

Publisher Resources

ISBN: 9798341629509

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño

by Steve Wilson

Capítulo 4. Inyección de prompt

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.